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(54) Bezeichnung: INFORMATIONSTRAGENDE UND INFORMATIONSVERARBEITENDE POLYMERE 
(57) Abstract 

The invention relates to methods for producing information-carrying polymers, information-carrying polymers obtained using these 
methods, and to methods for isolating, duplicating, and selecting such information-carrying polymers. The invention also relates to polymeric 
data memories and DNA computers which contain the information-carrying polymers, and to the use of information-carrying polymers for 
producing molecular weight standards, as markers or signatures, for encoding information, as molecular-scale adhesives, or for producing 
or processing the smallest molecular structures. 

(57) Zusammenfassung 

Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen Verfahren erhaltliche information 
stragende Polymere; Verfahren zur Isolierung, zur Vervielfaltigung und zum Auslesen solcher informationstragender Polymere; polymere 
Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die Verwendung informationstragender Polymere 
zur Herstellung von Molekulargewichtsstandards, als Marker oder Signaturen, zur Verschlusselung von Information, als molekulare Kleber 
oder zur Herstellung oder Bearbeitung kleinster molekularer Strukturen. 
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Informationstragende und informationsverarbeitende Polymere 
Beschreibung 

5 Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen 
Verfahren erhaltliche informationstragende Polymere; Verfahren zur Isolierung, zur 
Vervielfaltigung und zum Auslesen solcher informationstragender Polymere; polymere 
Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die 
Verwendung informationstragender Polymere zur Herstellung von 
10 Molekuiargewichtsstandards, als Marker oder Signatures zur Verschlusselung von 
Information, als molekulare Kleber oder zur Herstellung Oder Bearbeitung kleinster 
molekularer Strukturen. 

Es ist bekannt, Nukleinsauren zur Markierung von Materialien zu verwenden. Die US- 
15 05451505 beschreibt die Idee, Nukleinsauren der Lange 20-1000bp zur Kennzeichnung von 
Materialien zu verwenden, die zum Zwecke der Authentifizierung dienen konnen. Ganz 
grundsatzliche Probleme wie das Konstruieren von geeigneten Sequenzen oder von 
geeigneten Kodierungen zur Representation von Information werden jedoch nicht diskutiert, 
geschweige denn, befriedigend gelost. 

20 

Es ist bekannt, Nukleinsauren wie DNA (Deoxiribonucleic Acid = Desoxyribonukleinsaure) und 
RNA (Ribonucleic Acid = Ribonukleinsaure) auch auBerhalb von Organismen zur 
Informationsverarbeitung zu verwenden. Es wurden bisher verschiedene Ansatze, DNA 
Molekule zur Informationsverarbeitung zu verwenden, vorgestellt. 

25 Die WO 97/07440 und [L. M. Adleman, Molecular Computation of Solutions to Combinatorial 
Problems, Science, 266, 1021-1024. (1994)] beschreiben ein Verfahren, einen Graphen- 
Algorithmus (TJamiltonian-Pfad-Problem") als Entscheidungsproblem mit Hilfe von DNA 
Molekulen zu berechnen. Der Algorithmus wird implementiert, indem die Kanten und Knoten 
des Graphen als DNA Sequenzen reprasentiert werden. Die Berechnung des Algorithmus wird 

30 dadurch vorgenommen, dafB durch die Hybridisierung kompiementarer DNA Sequenzen eine 
Menge von Pfaden des Graphen erzeugt werden. 

Aus dieser Menge von Pfaden werden dann mit Hilfe molekularbiologischer Verfahren alle 
Pfade entfernt, die eine falsche oder keine Losung des Algorithmus sind. Wurden alle Schritte 
erfolgreich ausgefuhrt, so muB am Ende entweder mindestens ein DNA Strang ubrigbleiben, 
35 der die richtige Losung des Problems enthalt, oder es bleibt kein DNA Strang ubrig, was 
bedeutet, dafB der Algorithmus keine Losung hat. 

Das beschriebene Verfahren setzt voraus, daB genugend viele Molekule zur Verfugung 
stehen, damit jede mogliche Losung der jeweiligen Probieminstanz statistisch mindestens 
einmal in der Ausgangsmenge von Pfaden vorkommt. Dies kann aufgrund der statistischen 
40 Natur der Hybridisierungsvorgange jedoch nicht garantiert werden. AuBerdem konnen im 
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ersten Schritt auch zyklische Graphen entstehen, was von vorneherein die Menge falscher 
Losungen vergroBert. 

Der in WO 97/07440 beschriebene Ansatz zeigt, daB Symbolverarbeitung uberhaupt in vitro 
mit DNA Molekulen vorgenommen werden kann. Jedoch ist der beschriebene Ansatz in der 
5 Praxis kaum verwendbar: Ein Problem ist, daB der Algorithmus nicht deterministisch, sondern 
nur stochastisch ist, das gefundene Ergebnis ist damit nur mit einer bestimmten 
Wahrscheinlichkeit korrekt. Ein weiteres Problem ist, daB die Implementierung des 
Algorithmus nicht effizient (Laufzeit-optimal) ist, dadurch wird die Berechnung iangsam. 
Es wird dargelegt, daB das verwendete Verfahren zur Losung NP-vollstandiger Problema 

10 (einer Klasse von Problemen, fur die nur deterministische Losungsalgorithmen mit 
exponentieller Laufzeit bekannt sind und von der vermutet wird, daB es keine effizienten 
deterministischen Losungsalgorithmen gibt) besonders gut geeignet sei, weil .der Algorithmus 
aufgrund der Parallelitat der ausgefuhrten Operationen nur lineare Laufzeit benotige. Diese 
Argumentation ist jedoch insofern fehlerhaft, als die lineare Laufzeit durch eine exponentielle 

15 Anzahl von Molekulen kompensiert wird. Die exponentielle ProblemgroBe bleibt also 
unverandert bestehen. 

Insgesamt ist das in der WO 97/07440 beschriebene Verfahren zu sehr eingeschrankt, um fur 
molekulare Informatjonsverarbeitung uber den beschriebenen Algorithmus hinaus verwendbar 
zu sein: Das Hamiltonian-Pfad-Problem ist fest kodiert, andere Algorithmen konnen damit 

20 nicht berechnet werden, jede Probleminstanz muB neu kodiert werden. Programmierung ist 
nicht vorgesehen, alle Schritte des Algorithmus werden von Hand ausgefGhrt. Ein Input- 
/Output-System ist nicht vorgesehen. Insgesamt ist das Verfahren zur Programmierung von 
Algorithmen oder zur Implementierung eines Computers nicht geeignet. 
Die WO 97/29117 und [Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add, 

25 Science, 273, 220-223, (1996)] beschreiben ein Verfahren, Additionen mit Hilfe von DNA 
Molekulen auszufuhren. Die Addition erfolgt als Schiebeoperation mit Uberlauf-Ubertrag in 
vitro mit DNA Molekulen und Primer-Elongation. 

Das beschriebene Verfahren beschreibt ausschlieBlich Additionen. Jedoch ist selbst die 
Verwendung als Addierer aus mindestens zwei Grunden ungunstig: Zum einen ist Addition mit 

30 dem beschriebenen Verfahren nicht effizient (Laufzeit-optimal) implementiert. Zum anderen ist 
das verwendete System formal unvollstandig, weil die durch Addition erzeugten Ergebnisse 
ihrerseits nicht mehr als Zahlen fur Berechnungen verwendet werden konnen. Ober die 
Addition hinausgehende Konzepte fehlen. Insgesamt ist das Verfahren zur Programmierung 
von Algorithmen oder zur Implementierung eines Computers nicht geeignet. 

35 In [Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal 
Clique Problem, Science, 278, 446-449, (1997)] wird ein Verfahren beschrieben, einen 
Algorithmus zur Losung des "Max-Clique-Problem"s zu implementieren. Der Algorithmus 
stammt aus der Graphentheorie und failt unter die NP-vollstandigen Probleme. Wie in [L. M. 
Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 

40 1021-1024, (1994)] ist das Verfahren nur in der Lage, einen fest kodierten 
Losungsalgorithmus zu berechnen. Auch hier wird das Ergebnis nur mit einer bestimmten 
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Wahrscheinlichkeit erhalten. Das von den Autoren beschriebene Verfahren enthalt keine 
weiterfuhrenden Konzepte (etwa in Hinsicht der Implementierung auch anderer Algorithmen). 
Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung 
eines Computers nicht geeignet. 
5 In [Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self- 
assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting 
on DNA Based Computers, Princeton University, June 20-12, (1996)] wird erortert, regulare 
Grammatiken in DNA durch Verknupfung von Oligonukleotiden mit "sticky ends" zu 
implementieren. Die Ausfuhrungen sind jedoch rein iheoretischer Natur und scheitern an 

10 wesentlichen, bisher ungelosten Problemen. Insbesondere wird nicht dargelegt, wie die zur 
Implementierung von Grammatiken benotigten Sequenzen konstruiert werden mussen. 
Gerade dies ist aber das entscheidende Problem, ohne dessen Losung Grammatiken nicht 
implementiert werden konnen. Der Grund dafur liegt darin, daB die Sequenzen, die die 
Variablen und Terminate einer Grammatik reprasentieren, sowohl eindeutig, als auch 

15 untereinander hinreichend unahnlich sein mussen. AuBerdem mussen sie bestimmte 
strukturelle, chemische und physikalische Eigenschaften erfullen. Andemfalis sind 
Fehlhybridisierungen zwischen Sequenzen zwangslaufig, die bei der Polymerisierung zu 
ungewollten Kettenverlangerungen und Kettenabbruchen fuhren und damit das Funktionieren 
des Verfahrens unmoglich machen. Dieses Problem verscharft sich mit der Anzahl der 

20 benotigten Sequenzen exponentiell. 

Das beschriebene Verfahren wird von den Autoren selbst wieder verworfen, bzw. insofern als 
unzureichend bezeichnet, als es keine sonderlich interessanten Berechnungen erlaube (Erik 
Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of 
DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA 

25 Based Computers, Princeton University, June 20-12* (1996), S. 8, 2. Absatz, 1 . Zeile). 

Weiterfuhrende Experimente der Autoren stutzen sich entsprechend auch nicht weiter auf 
regulare Grammatiken und lineare Polymere, sondem auf kontextsensitive Grammatiken zur 
Erzeugung von DNA Gitterstrukturen [Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C. 
Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, 

30 (1998)]. Der von den Autoren beschriebene Ansatz ist womoglich zur Erzeugung DNA- 
basierter Nanostrukturen (Herstellung von Katalysatoren usw.) geeignet. Zur 
Informationsverarbeitung eignet er sich hingegen nicht, hier sind die erzeugten 
Gitterstrukturen eher hinderlich. 

Zwar sprechen die Autoren von der Moglichkeit, das mathematische Konzept der "Wang tiles" 
35 durch die erzeugten Gitterstrukturen zu realisieren und damit potentiell auch fur 
Berechnungen zu verwenden, sie bleiben aber bei der bloGen Erwahnung einer solchen 
Moglichkeit, ohne zu beschreiben, wie dies im Sinne einer Informationsverarbeitung genutzt 
werden kann. 

Es ist uberhaupt zweifelhaft, ob der von den Autoren beschriebene Ansatz uberhaupt zu einer 
40 Informationsverarbeitung geeignet ist: Die Gitterstrukturen verhindern die Vervielfattigung 
informationstragender Sequenzen (z.B. durch Klonierung Oder PCR = Polymerase Chain 
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Reaction = Polymerase Kettenreaktion) und machen es unmoglich, die erzeugten Strukturen 
a!s Daten zu verwenden, weil diese nicht mehr, etwa durch PCR, ausgelesen werden konnen. 
Entsprechend siehU der gewahlte Ansatz in der jetzigen Form konzeptionell gar keine 
Moglichkeit vor, die erzeugten Strukturen im Sinne einer Informationsverarbeitung, etwa als 
5 Daten, zu nutzen. * 



Aus dem Stand der Technik ist bisher kein Verfahren bekannt, das es erlaubt, DNA Molekule 
fur die Implementierung effizienter Algorithmen zu verwenden. Es ist kein Verfahren bekannt, 
Berechnungen automatisch (etwa in Art eines molekularen Computers) durchzufuhren. Es ist 
10 auch kein Verfahren bekannt, Programme in Form von regularen Grammatiken mit 
molekularen Verfahren so zu implementieren, daB damit 

a) unterschiedliche (im Ideaifall beliebige) regulare Grammatiken implementiert werden 
l^onnen 

i 

b) die mit regularen Grammatiken erzeugten Worter einer Sprache ausgelesen werden 
1 5 konnen 

c) die mit regularen Grammatiken erzeugten Worter einer Sprache fur technische Zwecke 
(z.B. Informationsverarbeitung, Polymerchemie) weiterverwendet werden konnen. 

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren bereitzustellen, 
20 das es erlaubt. Informationsverarbeitung auf molekuiarer Basts mithilfe regularer 
Grammatiken vorzunehmen, ohne dabei auf eine oder wenige Grammatiken eingeschrankt zu 
sein. Das Verfahren soli kompatibel zu herkommiichen Computem sein und eine 
Informationsverarbeitung erlauben, die teilweise auf molekuiarer Basis und teilweise auf der 
Basis herkommlicher Computer stattfindet. Das Verfahren soli programmierbar und 
25 weitgehend automatisierbar sein. Die innerhalb des Verfahrens erzeugten Polymere soiien 
lesbar und fur weiterfuhrende Anwendungen und Verfahren verwendbar sein. 



Diese Aufgabe wird geldst durch ein Verfahren zur Herstellung informationstragender 
30 Polymere, das umfaBt, 

I. eine regulare Grammatik G = (E, V, R, S) mit einem endlichen Terminalatphabet Z, 
einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem 
Startsymbol S zu definieren; 

II. das NFR- Verfahren (Niehaus-Feldkamp-Rauhe- Verfahren) zur Herstellung von 
35 Monomersequenzen (Oligo- oder Polymere); 

III. mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, 
indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer 
Grammatik G eindeutig darstellen; 

IV. aus den in Schritt III hergestellten Monomersequenzen fur jede Regel der 
40 Regelmenge R von G ein die Regel reprasentierendes Oligomer (Aigomei) 

zusammenzusetzen (Algomer-Assemblierung)] 
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V. die in Schritt IV zusammengesetzten Oligomere (Algomere) zu informationstragenden 
Polymeren zu verknupfen (Symbolpolymerisation). 

im Rahmen der voriiegenden Erfindung werden folgende Definitionen und Abkurzungen 
5 verwendet: 



Algomer 

10 Auslese-PCR 
Biochip 

15 Bitpolymerisation 
Byte 

Elongator 
20 Grammatik 



25 



30 



35 



40 



Logomer 



Monomer 



Multibyte 



Doppelstrangiges Oligomer, das eine Regel einer gegebenen 
Grammatik reprasentiert. Algomere konnen miteinander zu Logomeren 
verknupft werden. 

PGR, die zum Auslesen der in Logomeren enthaitenen Information 
verwendet wird. 

Auch als Microarray, DNA-Array, Gene-Array, Gene-Chip bezeichneter 
Trager einer Anzahl von Nukleinsauren, die zur Detektion 
komplementarer Sequenzen benutzt werden. 

ProzeB des Verkettens von Algomeren zu Logomeren, wenn es nur zwei 
verschiedene Elongatoren gibt. 

Informationseinheit aus 8 Bit, bzw. Molekul, das 8 Bit reprasentiert. 
Algomer mit zwei Oberhangsequenzen; kann mit Terminator oder 
Elongator ligieren und f uhrt zu einer Kettenverlangerung. 
Formalismus, der Sprachen beschreibt. Er basiert auf der formalen 
Theorie von Sprachen [Chomsky, N M Three models for the description 
of language, JACM, 2:3, 113-124, (1956)], [Chomsky, N., On certain 
formal properties of grammars, inf. and Control, 2:2, 137-167, (1959)], 
[Chomsky, N., Formal properties of grammars, Handbook of Math. 
Psych., 2, 323-418, (1963)]. 

Eine Grammatik G beschreibt eine Sprache L(G), das Alphabet dieser 
Sprache und deren Syntax. Nach einer Grammatik G konnen alle 
Worter dieser Sprache erzeugt werden. 

Eine Grammatik G ist ein Quadrupel (£, V, R, S) mit Terminalalphabet S, 
Variablenmenge V, Startsymbol S und Regelmenge R. 
Polymer, das symbolische Informationen tragt und durch die Verkettung 
von Algomeren erzeugt wurde. Entsprechend besteht ein Logomer aus 
sich wiederholenden Einheiten von Algomeren. Ein Logomer 
reprasentiert ein Wort einer Sprache L(G), die von der entsprechenden 
Grammatik G erzeugt wird. 

Einzelmolekul. Mehrere Monomere konnen zu langeren Ketten verknupft 
werden und so Oligomere und Polymere bilden. 

Monomere sind im Fall von Desoxyribonukleinsaure die Nukleotide 
(Adenin, Cytosin, Guanin, Thymin wie auch sog. Basenanaloga wie 
Hypoxanthin etc.). 

Eine beliebige Datenstruktur, die aus Vielfachen von Bytes besteht. 
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Kurzkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). 
Auch kurze doppelstrangige Molekule werden als Oligomere bezeichnet. 
Polymerase Chain Reaction = Polymerase Kettenreaktion; Verfahren zur 
exponentiellen Vervielfaltigung von DNA. 

Die PCR benotigt ein DNA Template, das vervielfaltigt wird, und zwei 
Primer, die jeweils gegenlaufig im Template ansetzen und als 
Startpunkte einer DNA Polymerisation fungieren. Durch iterative 
Wiederholung von Schmelzen-Hybridisierung-Polymerisations-Zyklen 
wird das DNA Template vervielfaltigt. 

Langkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). 
auch: Produktionsregel, Ersetzungsregel Oder Ableitungsregel. 
Beschreibt die Ersetzung von Symbolen durch andere. Durch die 
wiederholte Anyvendung von Regeln konnen Symbolketten erzeugt 
werden. 

Informatik: Abfolge von Zeichen; 

Chemie: Abfolge kovalent verbundener Monomere; 

Molekularbiologie: Abfolge kovalent verbundener Nukleotide. 

Zwei Sequenzen sind dann komplementar, wenn sie miteinander 

hybridisieren konnen. fm Falle von DNA sind z.B. die Sequenzen 

5'attt3' und 5'aaat3' komplementar, die Sequenz 5'acgt3' ist zu sich 

selbst komplementar. 

Variable innerhalb einer Grammatik, von der ausgehend, durch 
Anwendung der Regeln der Grammatik, eine Symbolkette erzeugt 
werden kann. 

ProzeB des Verkettens von Algomeren zu Logomeren. 
Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt 
(substituiert) werden. Terminate sind die "Buchstaben" der Worte einer 
Sprache L(G). 

Algomer mit einer Uberhangsequenz. Kann nur mit Elongator ligieren. 
Fuhrt zum Kettenabbruch bei einer Symbolpolymerisation. 
Eindeutigkeit von Sequenzen untereinander. Eine Sequenz S aus 
Monomeren ist 10-unique zu einer Menge M anderer Sequenzen, wenn 
jede Teilsequenz der Lange 10 von S in keiner anderen Sequenz der 
Menge M auftritt. Die Uniqueness kann auch in Prozent angegeben 
werden. Z.B. sind 2 Sequenzen der Lange 20, deren iangste 
gemeinsame Teilsequenz 5 Monomere betragt, zueinander 6-unique, 
ihre Uniqueness in Prozent betragt: (1 - 5/20) * 100 = 80%. 
Symbol einer Grammatik. Eine Variable kann gemaB der Regel einer 
Grammatik von Terminalen, Variablen oder Kombinationen von 
Terminalen und Variablen ersetzt werden. 
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Kurzbeschreibung der Abbildungen 



Abbildung 1: Algomere, wie in der Erlauterung zu Schritt IV des erfindungsgemaBen 
Verfahrens beschrieben. Die Algomere besitzen jeweils eine doppelstrangige Kernsequenz, 
5 die ein Terminal einer gegebenen Grammatik darstellt und mindestens eine einzelstrangige 
Uberhangsequenz, die eine Variable der gegebenen Grammatik darstellt, so daB jeweils ein 
Algomer genau eine Regel der gegebenen Grammatik reprasentiert. X und Y sind keine 
Variablen, sondern Uberhangsequenzen, die z.B. fur eine Klonierung benutzt werden konnen. 
Mit Uberstrichen dargestellte Buchstaben kennzeichnen Komplementaritat. GemaB der 
10 Definition sind AOA und A1A Elongatoren, XsA und AeY Terminatoren. Die hier dargestellten 
Algomere reprasentieren die im Folgenden beschriebenen Grammatik zur Erzeugung binarer 
Zufallszahlen. 

f 

Abbildung 2: Symbolpolymerisation, wie in der Erlauterung zum erfindungsgemaBen Schritt V 
15 beschrieben. Algomere werden durch Verkettung (im Falle von DNA: Hybridisierung und 
Ligation) zu Logomeren verknupft. Das Logomer Xs01010101eY beinhaltet eine terminierte 
Bitfolge, die durch die Uberhange X und Y in einer definierten Orientierung vervielfaltigt 
werden kann. 



20 Abbildung 3: Muster, das die Symbolpolymerisation fur binare Zufallszahlen nach 
Gelelektrophorese und Farbung zeigt (Spuren 1-3). Aufgrund der zufalligen Lange der binaren 
Zufallszahlen ergibt sich ein regelmaBiges Leitermuster. Spur 4 zeigt einen 50bp 
Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 

25 Abbildung 4: Klonierung eines durch Symbolpolymerisation erhaltenen Logomers in einem 
Vektor, wie zu Vervielfaltigung und Isolierung von Logomeren im Folgenden beschrieben. 

Abbildung 5: Schematische Darstellung eines Bandenmusters, das durch Auslesen eines 
binaren Logomers durch PCR und nachfolgende Gelelektrophorese erhalten wird (im 
30 Folgenden beschrieben). Im gezeigten Beispiel haben die Algomere eine Lange von 30bp 
(Uberhangsequenzen nur 1/2 gerechnet). Bei bekannter Lange des Logomers reicht es, 
jeweils nur Oen oder nur 1en auszulesen. Beide Bits auszulesen dient der Kontrolle. Das 
Verfahren kann auch fur mehrwertige Logomere (mehr als 2 Elongatoren) verwendet werden. 

35 Abbildung 6: Bandenmuster einer Gelelektrophorese nach PCR zum Auslesen von drei 
verschiedenen Logomeren. Die Logomere wurden nach der im Folgenden beschriebenen 
Grammatik fur Zufallszahlen beliebiger Lange erhalten. Als Zufallszahlen von unten nach 
oben gelesen ist a = 262, b = 97, c = 329. M (Spur 5) ist ein 50bp Molekulargewichtsstandard 
(Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 
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Abbildung 7: Schematische Darstellung des Auslesens von Logomeren durch 
Restriktionsverdau wie im Folgenden beschrieben. Die Elongatoren tragen 
Restriktionsschnittstellen, die derail asymmetrisch angeordnet sind, daB der 
Restriktionsverdau von Logomeren in einem eindeutigen Schnittmuster von Fragmenten 
5 resultiert. Das Schnittmuster entspricht Banden verschiedener Lange, und kann durch 
Geleiektrophorese sichtbar gemacht werden. R1 und R2 sind unterschiedliche 
Restriktionsenzyme, x und y bezeichnen die Lange der nach Restriktionsverdau erhaltenen 
Fragmente. ZweckmaBig ist z.B. ein Verhaltnis x:y von 1:2. 

10 Abbildung 8: Bandenmuster, die durch Geleiektrophorese nach dem Auslesen von 
Logomeren durch Restriktionsverdau erhalten werden. Spur 7 und 8 enthalten 
Molekulargewichtsstandards (Spur 7: 50pb Leiter, Gibco BRL, Life Technologies, Katalog Nr. 
1 041 6-01 4; Spur 8: 1 0bp Leiter) , 

15 Abbildung 9: Schematische Darstellung eines polymeren Datenspeichers auf der Basis von 
Algomeren und Symbolpolymerisation wie im Nachfolgenden beschrieben. Algomere konnen 
an Ankermoiekule (AM), die an einem festen Trager (C) gebunden ist, polymerisieren. Das 
Schreiben (W) erfolgt durch die wiederholte Abfolge (ReW) von Hybridisierungs-Ligations- 
Restriktionszyklen (Hyb, Lig, Res). Durch Denaturieren oder Restriktion (Den/Dig) konnen die 

20 erhaltenen Logomere abgetrennt und ausgelesen werden. 

Abbildung 10: Vereinfachte Darstellung der Bestandteile eines DNA Desktop Computers wie 
im Nachfolgenden beschrieben. Im Einzelnen sind: 

A: Oligo-Synthesizer, B: Thermozykler, C: Reaktionskammern, D: Pipettiervorrichtung, E: Gel, 
25 F: Scanner, G: Steuerungscomputer 
Es kennzeichnen: 

1 : Zugabe von Oligonukleotiden, 2: Zugabe synthetisierter Oligomere in Reaktionskammern 
des Thermozyklers, 3: Zugabe von Losungen und Molekulen, die zur Algomer-Assemblierung, 
Symbolpolymerisation, zur Isolierung von Logomeren und zum Auslesen benotigt werden. 

30 

Abbildung 11: Verschlusseiung von Logomeren wie im Folgenden beschrieben. Sind die 
Terminatoren und die darin primenden Primer unbekannt, so ist das jeweilige Logomer 
verschiusselt und kann nicht ausgelesen werden (A). Ist dagegen ein in einem Terminator 
primender Primer verfugbar oder die Sequenz eines Terminators bekannt, so kann das 
35 jeweilige Logomer gelesen werden (B). 

Abbildung 12: Y-formiges Molekul, das als Terminator bei der asymmetrischen 
Verschlusseiung von Logomeren verwendet werden kann. Elongatoren konnen an das mit 2 
markierte Ende angeknupft werden, weitere, z.B. Y-formige, Molekule an die mit 1 und 3 
40 bezeichneten Enden. Werden mehrere Y-formige Molekule miteinander verknupft, so erhalt 
man baumartige Strukturen. 
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Abbildung 13: Logomer mit Terminatoren s und e, die als baumartjge Strukturen realisiert 
sind. 

5 Abbildung 14: Mit einem Vektor V verknupftes Logomer L mit baumartigen Terminatoren. Die 
Terminatoren sind so konstruiert, daB jeweils nur ein Ast des Terminators mit dem Vektor 
verknupft werden kann. 

Abbildung 15: Markierung von Nukleinsauren mit Logomeren wie im Nachfolgenden 
10 beschrieben: Urn gentechnisch hergestellte Oder veranderte Produkte zu markieren, wird ein 
Logomer mithilfe rekombinativer Techniken in einen nicht-transkribierten Bereich, z.B. vor den 
Promotor (P) eines zu markierenden Genes (G) f eingesetzt. 

i : 

i 

Abbildung 16: Markierung von Dokumenten mit Logomeren wie im Nachfolgenden 
15 beschrieben. Spur 1 zeigt den verwendeten Molekulargewichtsstandard (50bp, Gibco BRL, 
Life Technologies, Katalog Nr. 10416-014), Spur 2 (O-Bits) und Spur 3 (1-Bits) das 
Bandenmuster des Auslesens von Logomer Nr. 330 durch PCR aus wassriger Losung, die 
Spuren 4 und 5 dasselbe wie die Spuren 2 und 3, wobei hierbei jedoch das Logomer Nr. 330 
nicht aus wassriger Losung, sondem in ca. 10 9 Molekulen///! getrocknet auf Papier (3M Post- 
20 It, 1 Stunde getrocknet) als Papierschnipsel (ca. 1mm 2 ) in die Auslese-PCR einging. 

Abbildung 17: Herstellung von Molekulargewichtsstandards durch Auslese-PCR, die ein 
unares Logomer als Template enthalt, wie im Nachfolgenden beschrieben. 1 zeigt die 
Anordnung verschachtelter Primer in der Auslese-PCR, 2 das nach Gelelektrophorese der 
25 PCR-Fragmente erhaltene Bandenmuster. 

Abbildung 18: Verkleben von Flachen mit Nukleinsauren wie im Nachfolgenden beschrieben. 
C bezeichnet die zu verklebende Flache, Log die Logomere, die zum Verkleben an die 
Flachen gebunden werden. 1 zeigt das Verhalten von Flachen mit nicht-komplementaren, 2 
30 das Verhalten von Flachen mit komplementaren Logomeren. 

Abbildung 19: Verkleben von Flachen mit Logomeren, Antikorpern und Liganden wie im 
Nachfolgenden beschrieben: C 0 und Ci bezeichnen die zu verklebenden Flachen, die aus 
gleichem oder unterschiedlichem Material bestehen konnen. Die zu verklebenden Flachen 
35 sind mit Logomeren (Log) versetzt. An die Logomere konnen Proteine, z.B. Antikorper vom 
Typ Ab A und Ab B binden, wobei Ab A und Ab B gleich oder verschieden sein konnen. Ab A 
und Ab B sind ihrerseits durch einen Liganden (Li) miteinander verbunden. 

Abbildung 20: Verkleben von Flachen mit Proteinen z.B. Antikorpern ohne Verwendung von 
40 Logomeren. C 0 und Ct bezeichnen die zu verklebenden Flachen, die aus gleichem oder 
unterschiedlichem Material bestehen konnen. Die Proteine vom Typ Ab A und Ab B binden 
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direkt an die zu verklebenden Flachen und sind ihrerseits durch einen Liganden (Li) 
miteinander verbunden. 

Abbildung 21: Bel der Verknupfung von Sequenzen zu langeren Sequenzketten kann es zu 
5 Verletzungen der vorgegebenen Uniqueness kommen, die Fehlhybridisierungen und damit 
Disfunktionalitat nach sich Ziehen kann. Dies ist auf das Entstehen neuer Basissequenzen (in 
der Abbildung markiert) aufgrund der Verknupfung zuruckzufuhren. 

Abbildung 22: Beispiel des Verknupfens von Terminalen mit einer Variablen. Durch die 
10 gezeigten vier Regeln einer Grammatik mit der Variable A ergeben sich vier verschiedene 
Pfade, die sich uber die Lange der Variablensequenz fur A uberschneiden. AuBerdem 
uberschneiden sich auch einige Sequenzen fur mehrfach vorkommende Terminale (b, c) t so 
daf3 links und rechts je drei Pfade zusammenlaufen. 

15 Abbildung 23: Haben mehr als vier verschiedene Variablensequenzen (A, B, C, D, E) 
Ubergange zu der gleichen Terminalsequenz (0), so muB mindestens eine Basissequenz 
mehrfach verwendet werden. Der gepunktete Rahmen zeigt den Iterationsschritt an, in der 
eine Verletzung der Uniqueness toleriert werden muB, urn alle Regeln aus R ubersetzen zu 
konnen. 

20 

Abbildung 24: Paralleles Auffullen zweier Sequenzenverlangerungen fur die Variablen A und 
B. Der gepunktete Rahmen zeigt den Iterationsschritt, in dem die Startbasissequenzen fur die 
Pfadsuche liegen. Ab dem nachsten Iterationsschritt konnen ggf. Verletzungen der 
Uniqueness toleriert werden. Zu beachten ist, daB sich hier Verzweigungen auch uber 
25 gruppengrenzen hinweg ergeben (z.B. des Terminals b zu den Variablen A und B). 

Abbildung 25: Skizze eines 1-Byte reprasentierenden Molekuls. Der mit x markierte Abschnitt 
enthalt eine eindeutige Sequenz, die einen definierten Bytewert darstellt (die fur die 
Darstellung aller Bytewerte benotigten 256 Nukleinsauresequenzen sind im Sequenzprotokoll 
30 aufgefuhrt). Der mit s markierte Abschnitt enthalt eine eindeutige Sequenz, die die 
Byteposition des betreffenden Bytes innerhalb von Multibytes kodiert und dient als Template 
fur PCR Reaktionen (siehe Sequenzprotokoll). Die mit o und e markierten Abschnitte dienen 
zur Herstellung von Multibytes aus einzelnen Bytes und als Template fur PCR Reaktionen 
(siehe Sequenzprotokoll). 

35 

Abbildung 26: Schematische Darstellung von vier 1-Byte Molekulen mit unterschiedlichen 
Bytepositionen (s 0 - s 3 ). Die Einzelbytes konnen zu Multibytes verbunden werden. 

Abbildung 27: Zum Zwecke der Vervielfaltigung konnen einzelne Bytemolekule in genetischen 
40 Vektoren (Plasmiden) kloniert werden. 
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Abbildung 28: Beispiel der Konstruktion eines Byte-reprasentierenden DNA Molekuls. Das 
Molekule besteht aus mehreren funktionellen Untereinheiten: Fur X gibt es 256 eindeutige 
Basenfolgen die alle Werte eines einzelnen Bytes darstellen. S ist eine eindeutige Sequenz, 
die die Position eines Bytes (das im Strang unmittelbar foigende X) innerhalb von Multibytes 
5 reprasentiert. O und E dienen a!s eindeutige Erkennungssequenzen fur die Verkettung 
einzelner Bytes zu Multibytes. 

DNA Bytes konnen unverkettet Oder verkettet zur Kennzeichnung verwendet werden. Durch 
das Ausschneiden der X Oder der SX Untereinheiten werden DNA Abschnitte gewonnen, die 
fur das "Spotteri" von Biochips verwendet werden. Die so hergestellten Biochips werden 
1 0 ihererseits zum Auslesen von einzelnen Bytes Oder Multibytes verwendet. 

Abbildung 29: Verkettung von Bytes zu Multibytes. Im Beispiel werden 4 Bytes zu einer 32-bit 
Datenstruktur verknupft. AuGerdem konnen die endstandigen Sequenzen L und R als Adapter 
fungieren, urn die 32-bit DNA Datenstruktur in andere DNA ! einzubringen. Sie konnen 
15 entweder spezifische Rekombinationssites Oder Restriktionssites tragen. Ein Beispiel ist die 
Kennzeichnung eines Plasmids in Abbildung 31 . 

Abbildung 30: Schematischer Aufbau eines 32-Bit Molekuls, das durch Verknupfung von 4 1- 
Byte Molekulen hergestellt wird. Das Molekul kann zum Zwecke der Kennzeichnung den zu 
20 markierenden Substanzen beigemischt Oder angeheftet werden. Zur Kennzeichnung von 
Nukleinsaurekonstrukten und Genen konnen die mit L und R bezeichneten Sequenzen 
Restriktions- Oder Rekombinationssites tragen, durch die sie mit dem zu markierenden 
Molekul verbunden werden. 



25 Abbildung 31 : Kennzeichnung eines Plasmids duch ein 32-bit Molekul. Das nullte Byte hat den 
Wert 109, das erste den Wert 67, das zweite den Wert 35, das dritte den Wert 192. Als 32-Bit 
Zahl ohne Vorzeichen entspricht das Bytemuster des gekennzeichneten Plasmids der Zahl 
3223536493. 

30 Abbildung 32: Skizze eines 1-Byte Biochips, der mit alien 256 x-Fragmenten (siehe Abbildung 
25 bis Abbildung 28) von x 0 bis Xass gespottet wurde (X-Chip). Dargestellt sind nur einige der 
256 unterschiedlichen Sequenzen. Zum Auslesen von Multibytes werden die jeweiligen 
Einzelbytes mit PCR voramplifiziert (s bis e) und einzeln auf getrennten Chips hybridisiert. So 
sind fur ein 4-Byte Molekul (siehe Abbildung 30) 4 PCR Reaktionen und 4 Chips erforderlich. 

35 

Abbildung 33: Skizze eines 1-Byte Biochips, der mit alien 256 SoX-Fragmenten (siehe 
Abbildung 25 bis Abbildung 28) von s 0 Xo bis SoX 25 5 gespottet wurde (SX-Chip). Dargestellt sind 
nur einige der 256 unterschiedlichen Sequenzen. Im Gegensatz zum Chiptyp aus Abbildung 
32 konnen hier die Hybridisierungsbedingungen so gewahlt werden, daB Bytes abhangig von 
40 ihrer Position in einem Multibyte detektiert werden. Im Beispiel werden nur SoXj aber keine SnX| 
mit n * 0 detektiert. Analog iassen sich 1-Byte Chips herstellen, die nur s^ detektieren usw.. 
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Das ermdglicht es, Chips herzustellen, die Multibytes direkt (ohne PCR) und vollstandig lesen 
konnen. Ein Beispiel ist der in Abbiidung 37 gezeigte 4-Byte Chip. 



Abbildung 34: Layout des 1-Byte Chips. Ist der Chip ais X-Chip implementiert (siehe 
5 Abbildung 32) enthalt er 256 Spots mit alien 256 x-Fragmente (siehe Sequenzprotokoll), ist er 
als SX-Chip (siehe Abbildung 33) implementiert enthalt er 256 Spots mit alien SjX-Fragmenten. 
Jedes x-Fragment reprasentiert genau einen Bytewert (Xq = 0, x, = 1, x 25 5 = 255). Die 
Sequenzen fur s und x sind so gewahlt, dal3 sie untereinander moglichst ahnliche 
Schmelztemperaturen haben, dabei aber" moglichst unterschiediiche Sequenzen, urn 
10 Fehlhybridisierungen auszuschlieBen. 

Abbildung 35: Herstellung von Muitibyte-Chips aus 1-Byte SX-Chips. Im Beispiel ist die 
Hersteilung eines 4-Byte Chips aus je einem SX 0 -, SXi-, einem SX 2 - und einem SX 3 -Chip 
gezeigt. Multibyte-Chips konnen z.B. zu linearen (a) Oder 2-dimensiohalen (b) Byte-Arrays 
1 5 angeordnet werden. 

Abbildung 36: Auslesen eines 32-Bit Molekuis (siehe Abbildung 30 und Abbildung 31) mit 
einem 4-Byte SX-Chip (siehe Abbildung 35). Zum Auslesen konnen 32-Bit Molekule direkt mit 
dem gesamten Chip hybridisiert werden. Dadurch kann der 32-bit Wert direkt ausgelesen 
20 werden (im Beispiel markiert). AuBerdem konnen die Bytes auch unabhangig voneinander mit 
PCR amplifiziert und getrennt voneinander hybridisiert werden. 

Alternativ dazu kann ein Multibyte-Chip auch aus identischen 8-Bit Einheiten aufgebaut sein, 
die nur mit X-Fragmenten gespottet sind. Urn die Positionsinformation der Bytes 
beizubehalten mussen dann die einzeinen Bytes getrennt voneinander in den jeweils 
25 korrespondierenden Sektoren gespottet werden. 

Abbildung 37: Multibyte Array aus identischen 1-Byte Chips (X-Chips). Multibyte Arrays aus X- 
Chips konnen ebenfalls zum Auslesen von Markierungsmolekulen verwendet werden wie 
bereits beschrieben wurde. AuBerdem konnen Multibyte Arrays zum Speichern und fur die 
30 optische Anzeige von Computerdaten verwendet werden. 



Sequenzprotokoll: Molekule, die fur die Herstellung der unten beschriebenen 32-Bit Molekule 
benottgt werden. Die Molekule werden wie unten beschrieben zu Algomeren 
zusammengesetzt. Die o, s, e und x Einheiten werden wie unten beschrieben zu Bytes 
35 zusammengesetzt. Diese werden wiederum wie unten beschrieben zu Multibytes (im Beispiel 
zu 4-Byte = 32-Bit Molektilen) zusammengesetzt. Die 32-Bit Molekule werden ihrerseits z.B. 
zur Kennzeichnung und Markierung verwendet und auBerdem zur Herstellung von Biochips 
(wie unten beschrieben) verwendet. 



40 
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Erlauterung zu I: Wahl von Grammatiken 

Eine Grammatik ist ein Quadrupe! G = (Z, V, R, S) mit einem endlichen Terminalalphabet Z, 
einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S. 
5 Fur eine Sprache L(G), die durch G beschrieben wird, konnen alle Worter aus L als Worter 
uber dem Terminalalphabet Z gebildet werden, indem man das Startsymbol S entsprechend 
den Regeln aus R ableitet. 

Die Definition einer Grammatik G nach Schritt I des erfindungsgemaften Verfahrens ist 
insofern frei, als beliebige, endliche Mengen von Terminalen und Variablen kodiert werden 
10 konnen. ErfindungsgemaB bevorzugt ist jedoch die Definition von Grammatiken, die die 
Binardarstellung von Daten gestattet, insbesondere von Grammatiken mit 
Z:= {0, 1, s 0 , s,, s 2 , s n . l5 s m e 0 , e 1f e 2 , e^, e m } mit n.meiV und n, m > 0. 
Diese ermdglichen die Herstellung binarer Logomere. 

Zur Veranschaulichung wird im Folgenden eine erfindungsgemaR definierte regulare 
15 Grammatik zur Erzeugung von Zufallszahlen beliebiger endlicher Lange in Binardarstellung 

gezeigt: 

Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet Z:= {0, 1 , s, e}, Variablenmenge 

V:={A}, Startsymbol S und Regelmenge 

R:= 
20 { 

S:=sA 

A->0A 

A->1A 

A->e 
25 }, 

wobei 

s:= Start 

e:= Ende 

sind. 

30 

Mit dieser Grammatik konnen Worter uber dem Terminalalphabet 
Z:={0, 1,s.e} 

gebildet werden. Alle Worter der Sprache L beginnen mit „s tt und horen mit „e" auf t 
dazwischen befindet sich eine zufallige Anzahl (auch 0) zufalliger Bits („0 W und „1"). 
35 Worter aus der Sprache L, die nach R gebildet werden, sind beispielsweise: 

a) S->sA->se 

b) S->sA->s1A->s1e 

c) S->sA->s0A->sOOA->s001 A->s001 0A->s001 Oe 

d) S->sA->s1 A->s1 0A->s1 00A->s1 000A->s1 00OOA->s1 00000A->s1 OOOOOe 

40 
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Die als Worter der Spache L erzeugten Binarmuster konnen als beliebige jedoch eindeutige 
Darstellung von Datentypen, z.B. als Buchstaben, Zahlen, alphanumerische Zeichen Oder 
Zeichenketten gelesen werden. Liest man sie als die Binardarstellung von Zahlen, so sind die 
obigen Worter in Dezimaldarstellung: 
5 a) 0 (leer) 

b) 1 

c) 2 

d) 32. 

10 

Erlauterung zu II: das NFR-Verfahren zur Herstellung von Monomersequenzen 

Das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) ist ein Verfahren zur Herstellung 
von Monomersequenzen (Oligo- und Polymeren, z.B. Nukleinsauren), das gewahrleistet, daB 
1 5 die mithilfe des Verfahrens hergestellten Monomersequenzen: 

a) eine eindeutige und einzigartige Abfolge von Monomeren haben; 

b) zueinander mdglichst unahniich sind und daher moglichst keine Fehlhybridisierungen 
untereinander eingehen; 

c) bestimmte strukturelle Eigenschaften aufweisen, z.B. ein bestimmtes Verhaltnis der 
20 verschiedenen Monomere zueinander, das Enthaltensein oder Nicht-Enthaltensein 

bestimmter Teilsequenzen und eine maximale Ubereinstimmung (Homologie) 
untereinander; 

d) bestimmte chemische Eigenschaften aufweisen, z.B. das Vorkommen bestimmter 
chemisch aktiver Teilsequenzen, die EinfluB auf chemische Reaktionen, im Falle von 

25 Nukleinsauren insbesondere die Wechselwirkung mit Proteinen haben 

(Proteinbindungsstellen, Restriktionsschnittstellen, Stopcodons); 

e) bestimmte physikalische Eigenschaften aufweisen, z.B. eine bestimmte 
Schmelztemperatur. 

30 Das NFR-Verfahren erlaubt die Herstellung eindeutiger, moglichst unahnlicher 
Monomersequenzen mit vordefinierbaren strukturellen, chemischen und physikalischen 
Eigenschaften. Es eignet sich zur Herstellung von Monomersequenzen fur kontrollierte 
chemische Reaktionen, wie sie z.B. fur eine molekularen Informationsverarbeitung benotigt 
werden. Es wird in Schritt III des erfindungsgemaBen Verfahrens fur die Implementierung 

35 regularer Grammatiken venwendet. 

Das NFR-Verfahren ist eine erfindungsgemaBe Fortbildung des Niehaus-Verfahrens zur 
Erzeugung eindeutiger, moglichst unahnlicher Sequenzen, das in [Jens Niehaus, DNA 
Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der 
Universitat Dortmund, Lehrstuhl XI, 116-123, (1998)] beschrieben ist, und worauf hiermit in 

40 vollem Umfang Bezug genommen wird. 
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Das NFR-Verfahren ist insofem eine erfindungsgemaBe Fortbildung des Niehaus-Verfahrens, 
ats erst das NFR-Verfahren die Hersteilung von Monomersequenzen erlaubt, wie sie fur eine 
Herstellung in vitro, z.B. zur Implementierung von Grammatiken, bendtigt werden. Die Grunde 
sind im Einzelnen: 

5 a) Das Niehaus-Verfahren beschreibt nur die Konstruktion von Sequenzen aus 
Basissequenzen der Lange 6. Da die Lange von Basissequenzen die maximal zwischen 
verschiedenen Monomersequenzen moglichen Uberlappungen beschreibt, daher 
unmittelbaren EinfluG auf das Hybridisierungsverhalten von Sequenzen und das 
Funktionieren der erfindungsgemaSen Schritte IV und V hat, muB das Verfahren jedoch fur 
10 Basissequenzen beliebiger Lange veraligemeinert werden, was im NFR-Verfahren 

vorgenommen wurde. 

b) Das Niehaus-Verfahren erlaubt nur die Erzeugung von Sequenzen gleicher Lange, 
wohingegen das NFR-Verfahren Sequenzen unterschiedlicher Lange und unterschiedlicher 
Anzahl erzeugen kann. Letzteres ist fur ein korrektes Hybridisierungsverhalten von 

1 5 Sequenzen und das Funktionieren der erfindungsgemaBen Schritte IV und V unerlaBlich. 

c) Das Niehaus-Verfahren gewahrleistet Eindeutigkeit und maximale Unahnlichkeit von 
Sequenzen nur fur Sequenzen, die durch eine einmalige Anwendung des Verfahrens 
erzeugt wurden. Zwingend erforderlich ist jedoch, auch zu schon existierenden Sequenzen 
jeweiis kompatible, d.h. eindeutige und maximal unahnliche Sequenzen erzeugen zu 

20 konnen. Das NFR-Verfahren kann im Gegsatz zum Niehaus-Verfahren zu beliebig 
vorgegebenen Sequenzen kompatible (d.h. eindeutige und maximal unahnliche) neue 
Sequenzen erzeugen. Dabei kann das Verfahren beliebig oft auf dieselbe Menge von 
Sequenzen angewendet werden. 

d) Das Niehaus-Verfahren beschrankt zwar die maximale Lange gemeinsamer 
25 Teilsequenzen, jedoch nicht deren Anzahl. Daher konnen 2 beliebige nach dem Niehaus- 
Verfahren konstruierte Sequenzen mehrere gemeinsame Teilsequenzen beinhalten, was 
ungewollt zu einer hohen Homologie (Sequenzubereinstimmung) fuhren kann. Die 
Homologie hat ihrerseits unmittelbaren EinfluB auf das Hybridisierungsverhalten von 
Sequenzen und das Funktionieren der erfindungsgemaBen Schritte IV und V. Das NFR- 

30 Verfahren dagegen fuhrt bei der Konstruktion von Sequenzen auch einen 
Homologievergleich durch und vermeidet dadurch ungewollte Fehlhybridisierungen. 

e) Das Niehaus-Verfahren erlaubt nicht die Integration bestimmter, vorgebbarer Sequenzen 
und Teilsequenzen. Solche Sequenzen sind jedoch fur die Ausfuhrung und Kontrolle 
bestimmter chemischer Reaktionen, z.B. kontrollierter enzymatischer Wechseiwirkungen, 

35 zwingend notwendig. Beispiele fur solche Sequenzen sind im Falle von Nukleinsauren 
Proteinbindungsstellen, Restriktionsschnittstellen und Stopcodons. Dagegen erlaubt das 
NFR-Verfahren die Integration beliebiger Sequenzen und Teilsequenzen in die Herstellung 
von Monomersequenzen und gewahrleistet gleichzeitig Eindeutigkeit und maximale 
Unahnlichkeit. 

40 f) Das Niehaus-Verfahren sieht keine Moglichkeit vor, Sequenzen mit bestimmten 
strukturellen, chemischen oder physikalischen Eigenschaften zu erzeugen. Dagegen 
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enthalt das NFR-Verfahren die Moglichkeit, Sequenzen mit bestimmten strukturellen, 
chemischen tind physikalischen Eigenschaften herzustellen. Dazu zahlen u.a. das 
Verhaltnis verschiedener Monomere zueinander und die Schmelztemperatur. Auch dies ist 
fur die Implementierung von Grammatiken in vitro eine unbedingte Voraussetzung. 
5 g) Das Niehaus-Verfahren erlaubt keine direkte Erzeugung regelreprasentierender 
Sequenzen, wie sie zur Implementierung von Grammatiken benotigt werden. Dagegen 
ermoglicht das NFR-Verfahren die Erzeugung symboireprasentierender Sequenzen, die 
zu den fur die Implementierung einer Grammatik benotigten regelreprasentierenden 
Sequenzen verknupft werden konnen. 
10 h) Nur mithilfe des NFR-Verfahrens konnen Sequenzen auch so konstruiert werden, daB die 
Eigenschaften der Eindeutigkeit, maximalen Unahnlichkeit sowie strukturelle, chemische 
und physikalische Eigenschaften auch fur Teilsequenzen gelten. Z.B. lassen sich im Falle 
von Nukleinsauren Monomersequenzen so herstellen, daB sowohl die Gesamtsequenz, als 
auch z.B. das erste Drittel der Sequenz einen 50%igen GC-Anteil haben. Diese 
Eigenschaft ist z.B. fur das Funktionieren der Verkettung von Sequenzen, die pro Molekul 
fur mehrere Hybridisierungsereignisse vorgesehen sind (wie z.B. die im Folgenden 
beschriebenen Algomere), eine unbedingte Voraussetzung. Nur so lassen sich z.B. 
Sequenzen so konstruieren, daB unterschiedliche Hybridisierungsereignisse pro Molekul 
gleichwahrscheinlich sind. 
i) Nur das NFR-Verfahren erlaubt die unmittelbare, automatische Herstellung von 

Monomersequenzen, z.B. durch einen Oligonukleotidsynthesizer. 
j) Bei der Verknupfung von Sequenzen zu langerkettigen Sequenzen kann es zu 
Verletzungen der Uniqueness kommen. Fur die korrekte Herstellung von Polymeren durch 
das Verknupfen von Oligomeren (wie z.B. das VerknOpfen von Algomeren zu Logomeren) 
ist es unbedingt ertorderlich, daB diese Uniqueness-Verletzungen nur in einem 
vordefinierten Bereich auftreten, damit keine unkontrollierten Fehlhybridisierungen 
auftreten (siehe Abbildung 21). Dieses Problem tritt ganz grundsatzlich auf und muB 
insbesondere fur die Verknupfung von Algomeren und die Verknupfung von Variablen und 
Terminalen gelost werde, weil sonst eine Ubersetzung von Grammatiken in Molekule 
unmoglich ist. Das Niehaus-Verfahren lost dieses Problem nicht und ist daher fur die 
Ubersetzung von Grammatiken in Molekule ungeeignet. Das Problem wird unter 
Verwendung des NFR-Verfahrens durch eine "Parallel-Extension" Strategie gelost. Diese 
wird im Folgenden erlautert. 
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Zur Herstellung von Monomersequenzen werden diese durch das NFR-Verfahren konstruiert 
und synthetisiert. Zur Herstellung von n Monomersequenzen wird das NFR-Verfahren wie im 
Folgenden beschrieben durchgefuhrt, wobei zur Beschreibung des Verfahrens folgende 
Abkurzungen benutzt werden: 
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Ueq 

S S eq 

S S eq,k 

10 l b a S 
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5bas 



'basA 



seq 



M seq 
M bas 
25 M 



nobas 
|Mnobas| 

n 

n to t 
h 

tm 



Alphabet der Machtigkeit a e IN; 

Im Falle von DNA ist A:= {a, c, g, t} und a = 4. 

Sequenz. 

Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren 
entspricht. 

Lange der pro Verfahrenszyklus zu konstruierenden Sequenzen. 
Sequenz der Lange Iseq. 

(k-1)-tes Monomer der Sequenz S seq (k e Z7V; k <= l seq ). 

Lange der pro Verfahrenszyklus zur Konstruktion von Sequenzen 

verwendeten Basissequenzen. 

Es gilt: 0 < l bas <= l seq . 

Sequenz der Lange lbas = Basissequenz; Sequenzen der Lange lseq werden 
aus Basissequenzen konstruiert. 

maximale Lange der Kette aufeinanderfolgender Monomere, die jeweils zwei 
durch das Verfahren erzeugte Sequenzen gemeinsam haben („overlap"). 
lbas - 1 - 

Verhaltnis von maximal eiiaubter Sequenzwiederholung zu 
Sequenzgesamtlange; 

1 . MaB fur die Fehlhybridisierungswahrscheinlichkeit. 
Verhaltnis von Basissequenzlange zu Sequenzgesamtlange; 

2. MaB fur die Fehlhybridisierungswahrscheinlichkeit. 
Menge von Sequenzen. 

Menge aller Basissequenzen der Lange l^. 

Teilmenge der Menge von Basissequenzen der Lange lbas, die durch 
Dekomposition aus M seq erhalten wird. 

Machtigkeit von M^^ = Anzahl der Basissequenzen in M^s- 
Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen. 
Anzahl insgesamt in alien Verfahrenszyklen hergestellter Sequenzen. 
maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen. 
Homologie. Ein MaB fur die Obereinstimmung zwischen zwei Sequenzen, 
Es gilt: 0 <= h <= 1 . 

Schmelztemperatur. Fur eine DNA-Sequenz wird die Schmelztemperatur nach 
dem Nearest Neighbour Verfahren (siehe Breslauer, K.J., Frank, R., Blocker, 
H. f Marky, L.A., Proc. Natl. Acad. ScL, 83, 3746-3750, 1989) bestimmt: 
^ = AH / (AS + R x ln(C/4)) - 273,1 5°C 

Dabei sind AH und AS Enthalpie und Entropie der DNA-Helix, R die molare 
Gaskonstante und C die Konzentration der DNA-Sequenz. 
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Das Herstellungverfahren erfolgt als ein Abfolge beliebig, jedoch endlich vieler 
Verfahrenszyklen, in denen n t01 Sequenzen konstruiert werden, und einer nachfolgenden 
Synthese, in der alle n to t Sequenzen in vitro erzeugt werden. 

Die maximale Anzahl n^ der pro Verfahrenszyklus konstruierbaren Sequenzen errechnet 
5 sich entsprechend den oben gegebenen Definitionen nach 

rw =/ (a, Ibas, l seq ) := L( Vz * ( (a ,bas ) - (a ,bas/2 ) - IM^I) ) / (U - U J - 
D.h. es lassen sich maximal n max Sequenzen der Lange l seq aus Elementen eines Alphabetes 
A der GroBe a (im Falle von DNA ist a = 4) konstruieren, die in maximal I ov 
zusammenhangenden Ketten von Monomeren ubereinstimmen. Die Anzahl der tatsachlich 
10 pro Verfahrenszyklus erhaltenen Sequenzen kann geringer sein, wenn diese bestimmte 
physikalische, chemische Oder strukturelle Eigenschaften aufweisen sollen, Oder wenn 
zusatzlich zu bereits vorhandenen Sequenzen weitere Sequenzen hergestellt werden. 



15 



Im Einzelnen sind.folgende Verfahrensschritte notig: 



1 Es werden n t0 t Sequenzen in z Verfahrenszyklen konstruiert und in einer Menge 
gesammelt. Man beginnt mit der ieeren Sequenzmenge Mseq. 

2 Zur Sequenzmenge M seq konnen einmalig, vor Beginn des Verfahrenszyklus, beliebige, 
jedoch eindeutige, Sequenzen hinzugefugt werden. Dies kann nutzlich sein, urn 

20 bestimmte Sequenzen hinzuzufugen, die aus Grunden der weiteren Anwendung in der 

Menge der hergestellten Monomersequenzen enthaiten sein sollen. Es empfiehlt sich 
dabei, nicht zu viele und nicht zu lange Sequenzen hinzuzufugen, da das Verfahren fur 
diese Sequenzen nicht dieselben Eigenschaften garantiert wie fur die im Folgenden 
konstruierten Sequenzen. 

25 3 Beginn des Verfahrenszyklus: Es werden die strukturellen, chemischen und 
physikalischen Eigenschaften festgelegt, die die herzustellenden Sequenzen erfullen 
mussen. Strukturelle Eigenschaften sind zumindest das Enthaltensein Oder Nicht- 
Enthaltensein bestimmter Teilsequenzen (ggfs. auch die Positionen, an denen die 
Teilsequenzen in den zu erzeugenden Sequenzen enthaiten oder nicht enthaiten sein 

30 sollen) und das Verhaltnis der Anzahl der verschiedenen Monomere zueinander (im Faile 

von DNA: Verhaltnis GC/AT). Chemische Eigenschaften sind mindestens das 
Vorkommen bestimmter Teilsequenzen, die EinfluB auf die chemische Wechselwirkung 
mit eigenen oder anderen Substanzen haben (im Falle von DNA z.B. bestimmte 
Proteinbindungsstellen, Restriktionsschnittstellen wie z.B. 5'gatatc3 c fur EcoRV, die 

35 Stopcodons 5'tca3', 5 4 tta3\ 5'cta3* usw.). Zu den festzulegenden physikalischen 

Eigenschaften zahlt zumindest die Schmelztemperatur t m der herzustellenden 
Sequenzen. 
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Es werden jetzt die Anzahl der pro Zyklus gewunschten Sequenzen n <= rw, nach 
obiger Forme! I seq der zu konstruierenden Sequenzen und ! bas der zur Konstruktion 
benotigten Basissequenzen festgelegt. I seq und l bas werden nach der oben angegebenen 
Formel so gewahlt, daB die gewunschte Anzahl n zu konstruierender Sequenzen erreicht 
werden kann. Da l ba Aeq proportional zur Fehlhybridisieaingswahrscheinlichkeit ist, 
werden l bas und l seq so gewahlt, daB das Verhaltnis i^sAse* moglichst gering ist (Werte 
unter 0,3 sind empfehlenswert) und Werte fur l seq gute Hybridisierungsbedingungen 
garantieren. Fur DNA sind temperaturabhangig beliebige Werte fur 1^ > 0 moglich. 
Es wird die Menge M bas aller Sequenzen des Alphabetes A der Lange 1^ erzeugt. Die 
solcherart erzeugten Sequenzen werden als Basissequenzen bezeichnet. Es gibt dabei 
immer a mas Basissequenzen. Diese Basissequenzen dienen der Konstruktion der 
herzustellenden Sequenzen. Jede Basissequenz bekommt einen Status „benutzt" Oder 
„unbenutzt" zugewiesen. Es werden zunachst alle als unbenutzt markiert. 
Selbst-komplementare Basissequenzen aus Mba S werden nun als benutzt markiert. Dabei 
gibt es genau a ,bas/2 zu sich seibst komplementare Basissequenzen. 
Soliten bereits Sequenzen in der Menge M seq vorhanden sein, so konnen entweder dazu 
kompatible neue Sequenzen konstruiert werden oder die Sequenzen einer Teilmenge 
von kompatibel verlangert werden. Dazu wird innerhalb eines 

Dekompositionsverfahrens aus den bereits vorhandenen Sequenzen aus Mseq eine 
Menge Mno bas aller Teilsequenzen der in Schritt 4 vorgegebenen Lange lbas der 
Sequenzen aus M seq gebildet: 

SetZe Mnobas = {}• 

Jede Sequeriz Sseq aus M seq wird nun in (l seq - U) Dekompositionsschritten zerlegt: 
Beginne mit i = 0 mit dem Dekompositionsschritt: 
Solange i < (lseq - U): 

Bilde als neue Sequenz Sneu als Sequenz der Lange 1^ bestehend aus den 

Monomeren Sse q .i bis Sseq,wba S : S^u := Sseq.s Sseqj+ibas- 

Fuge Sneu der Menge Mnobas hinzu. 

Setze i := i + 1 . 

Die auf diese Weise erhaltene Menge Mno bas ist definitionsgemaB eine Teilmenge von 

Alle Basissequenzen der Menge Mbas, die auch in M nobas vorkommen, werden als benutzt 
markiert, so daB fur die Konstruktion von Sequenzen genau (a ,Das - a 0 *** - |Mnobas|) 
unbenutzte Basissequenzen ubrig bleiben, aus denen nun maximal 

' ' {(a lb -)-(a^ n )-\M na ujfi \ 



(lseq — lav ) 
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verschiedene neue Sequenzen konstruiert werden konnen, die untereinander und zu den 
bereits vorhandenen Sequenzen keine Basissequenzen bzw. deren Komplemente 
gemeinsam haben. 

9 Aus den Basissequenzen wird ein gerichteter Graph konstruiert, dessen Knoten 
5 bestimmte Basissequenzen reprasentieren: Der Graph enthalt genau a ,bas Knoten, von 

denen bereits (a ,bas/2 + |Mno bas |) Knoten als benutzt markiert sind. Jeder Knoten ist mit 
einer Basissequenz S b(i) assoziiert, die nicht zu sich selbst komplementar ist (im weiteren 
wird es keine Unterscheidung von Knoten und assoziierter Basissequenz geben). 
Es existiert eine Kante von S b(i) nach S b(k)> wenn die U letzten Buchstaben von S b{j) den 
10 U ersten Buchstaben von S b (k) entsprechen, wenn also gilt: 

S b (i),2 . S b (j) f | ba s = S b (k),i, .... S b ( k ).| b as-1 • 

Der Knoten S b(k) wird Nachfolgeknoten von S b(j) genannt. 

Der Knoten, der mit dem Komplement der Basissequenz assoziiert ist, die durch den 
Knoten S b(i) kodiert wird, wird Komplementknoten zu Knoten genannt. 
15 Sequenzen der Lange l seq werden gefunden, indem ein Pfad mit (l seq - l ov ) Knoten gesucht 

wird. Jeder Knoten darf maximal einmal benutzt werden. AuBerdem darf fur jeden 
Knoten, der in einem der Pfade liegt, der Komplementknoten in keinem Pfad 
vorkommen. Der Anfangsknoten des Pfades tragt wie die Sequenz einen Status 
„benutzt M bzw. „unbenutzt". 
20 10 Aus dem Graphen konstruiert man Sequenzen nach folgendem Verfahren: 

Kennzeichne alle unbenutzten Knoten des Graphen als unbenutzte Anfangsknoten. 
Fur jedes s zwischen 1 und n: 

Solange Knoten S b(k) existiert, der noch nicht als benutzter Anfangsknoten 
markiert ist: 

25 Wahle einen unbenutzten Knoten S^ aus. 

Markiere Knoten S b(k) als benutzten Anfangsknoten; auBerdem: 

Markiere Sequenz S b(k) und sein Komplement als benutzt. 

Nun wird eine neue Sequenz S„eu konstruiert, die neues Element fur M seq ist 

Oder eine bestehenden Sequenz S sub aus Mseq verlangert: 
30 SetzeSneu.o:=S b(k)(1 . 

Falls sie als neue Sequenz konstruiert wird, setze i := 0. 

Falls sie als Verlangerung einer bereits bestehenden Sequenz S SU b konstruiert 

wird, setze i := l sub 

Solange i < l seq - (l ov -1) und i >= 0 gilt: 
35 Existiert kein unbenutzter Nachfolgeknoten S b(m) von Knoten S b(k) , so 

markiere Knoten S^^ und dessen Komplementknoten als unbenutzt und 
setze i := 

Sonst wahle per Zufall einen unbenutzten Nachfolgeknoten S b(m) von Knoten 
S b(k) aus und markiere b m und dessen Komplementknoten als benutzt. Setze 
zusatzlich: i := i+1 , k := m, S ne u.i := S b(m) . 
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Wenn i = l seq - (I 0V -1) ist, ist die Sequenz Sneu fertig: sie besteht aus den 

BUChStaben Sne U . 0 biS Sneu.Oseq.tov). 

11 Zu jeder der in Schritt 10 erhaltenen Sequenzen werden die jeweiligen 
strukturellen, chemischen und physikalischen Eigenschaften im Vergleich zu 

5 den in Schritt 3 festgelegten Bedingungen ermittelt. Genugt die jeweilige 

Sequenz nicht den vorgegebenen Bedingungen, so wird sie geloscht und die 
von ihr benutzten Knoten und Komplementknoten wieder als unbenutzt 
markiert. 

12 Wenn die Anzahl der konstruierten Sequenzen nicht ausreicht, kann der 
10 Verfahrenszyklus von Schritt 3 Oder 4 an beliebig oft wiederholt werden. Insbesondere ist 

es moglich, die strukturellen, chemischen und physikalischen Kriterien und die Werte fur 
n, Uq, 'bas pro Verfahrenszyklus jeweils neu zu setzen. So ist es moglich, Sequenzen mit 
unterschiedlichen strjukturellen, chemischen und physikalischen Eigenschaften, sowie 
unterschiedlicher Larjige zu konstruieren, die trotzdem kompatibel, also eindeutig und 
1 5 maximal unahnlich sind. 

Ansonsten geht man zum nachsten Schritt, der in vitro Synthese. 

13 Die konstruierten Sequenzen werden in vitro, im Falle von Nukleinsauren vorzugsweise 
mitteis eines Oligonukleotidsynthezisers (z.B. ABI 392, ABI 398, ABI 3948 von Perkin- 
Elmer Applied Biosystems), synthetisiert. Dazu werden die Sequenzdaten der 

20 Steuerungseinheit des Oligonukleotidsynthesizers ubermittelt und die Sequenzen als 

einzelstrangige Nukleinsauren hergestellt. Die Sequenzen konnen auch kommerziell 
bestellt werden. ZweckmaGig sind PAGE-gereinigte Oligonukleotide (z.B. von ARK 
Scientific GmbH Biosystems, 64293 Darmstadt, erhaltlich). 



25 Urn Grammatiken in Molekule ubersetzen zu konnen muB das oben erwahnte Problem der 
Uniqueness-Verletzung bei der Verknupfung von Sequenzen gelost werden (siehe Abbildung 
21). Dieses Problem ist mit dem Niehaus-Verfahren nicht zu behandeln, da dort keine 
Verknupfung von Sequenzen vorgesehen ist. Im Einzelnen ist das Niehaus-Verfahren fur die 
Losung folgender Teilprobleme nicht machtig genug: 

30 - Die Verknupfung von Sequenzen kann zu einer Uniqueness-Verletzung fuhren (siehe 
Abbildung 21). 

- Bei der Verknupfung von Variablen und Terminalen kann die Sequenz einer Variable je 
nach Grammatik in mehr als eine Terminalsequenz pro Ende ubergehen und umgekehrt 
(siehe Abbildung 22 und Abbildung 24). 
35 - Bei der Verknupfung z.B. mehrerer Terminalen mit der selben Variable kann es zu 
Uniqueness-Verletzungen kommen, die sich durch einfache Pfadsuche nicht auflosen 
lassen (siehe Abbildung 23). 

Das Problem wird mit einer als "Parallel-Extension" bezeichneten Strategie unter Verwendung 
40 des NFR-Verfahrens gelost. Dabei wird im Einzelnen folgendermaBen vorgegangen 
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(beispielhaft gezeigt fur die Konstruktion von Variablen zu vorgegebenen Terminalen, siehe 
auch Abbildung 22 bis Abbildung 24): 

1 . Eine Gruppe von Sequenzen (hier: die Terminate, z.B. Sequenzen zur Representation von 
Bits Oder Sequenzen mit bestimmten chemischen oder biologischen Eigenschaften) seien 

5 vorgegeben. 

2. Sammle fur jede Variable alle Paare von Terminalen, deren Sequenzen die jeweilige 
Variablensequenz im Logomer einrahmen werden und fasse sie zu Gruppen zusammen, 
eine Gruppe fur jede Variable (siehe Abbildung 22 und Abbildung 24). Ordne die Pfade 
der Terminalpaare so an, daG zwischen jedem Paar eine Lucke bieiot, deren Lange der 

10 Variablen pfadlange (l seq - i b as + 1) plus jeweils l bas - 1 Knoten fur jeden der beiden 

Ubergange entspricht. Dabei ist ein Ubergang derjenige Pfad der Lange Ibas - 1, der 
jeweils zusammengehdrende Terminale und Variablen miteinander verbindet. In 
Abbildung 21 besteht dieser z.B. aus den markierten Basissequenzen. Obergange konpen 
zusammenlaufen (z.B. die Terminale a, b, c zur Variable A in Abbildung 22) oder sich 

15 verzweigen (z.B. die Variable A zu den Terminalen b, c, d in Abbildung 22). 

3. Wahle die jeweils letzte Basissequenz jeder Terminalsequenz auf der linken Seite als 
Startknoten fur den jeweiligen Pfad (siehe Abbildung 24). 

4. Erzeuge die Terminal-Variabie-Ubergange simultan, d.h. suche in jedem Iterationsschritt 
fur alle Pfade je einen Nachfolgeknoten, dessen letztes Monomer fur alle Pfade einer 

20 Gruppe das selbe ist. Kann in diesem Schritt kein unbenutzter und ertaubter Knoten 

gefunden werden, so wird Backtracking ausgelost. Ist dieses nicht moglich, so scheitert 
die Ubersetzung einer Grammatik in Algomere an diesem Punkt und die Obersetzung 
muB mit veranderten (vorzugsweise weniger restriktiven) Parametern wiederholt werden. 
Zulassig ist dagegen die mehrfache Verwendung eines Knotens in einem Iterationsschritt 

25 fur die jeweils zusammengehorenden Ubergange (siehe Abbildung 23 und Abbildung 24). 

5. Erzeuge die Variablen-Sequenzen ebenfalls simultan als Verlangerung der Ubergange. 

6. Erzeuge die Variable-Terminal-Ubergange analog wie unter 4 beschrieben. Hierbei sind 
die Nachfolger jedoch nicht frei wahlbar, sondern durch die 1^ - 1 ersten Nukleotide der 
rechten Terminalsequenz vorgegeben. Die Pfadsuche folgt hier dieser Vorgabe urn 

30 festzustellen, ob die Pfade sich vervollstandigen lassen. 

Durch das als "Parallel-Extension" bezeichnete Verfahren wird es mdglich, eine Schnittstelle 
zwischen Computer und den in-vitro ausgefuhrten Schritten, beginnend mit der 
Synthetisierung von Oligonukleotiden, zu schaffen und die Schritte von Definition von 
Grammatiken bis zur Herstellung von Molekulen in-vitro volistandig zu automatisieren. 

35 
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Erlauterung zu III: Implementierung regularer Grammatiken mit dem NFR-Verfahren 



Die Herstellung von Monomersequenzen zur Darsteliung der Regelmenge von Grammatiken 
in Schritt III des erfindungsgemaBen Verfahrens erfolgt mit Hilfe des NFR-Verfahrens 
5 (Niehaus-Feldkamp-Rauhe-Verfahren) nach Schritt II des erfindungsgemaBen Verfahrens. 
Zur Implementierung von Grammatiken werden nach dem NFR-Verfahren fur r Regeln einer 
Grammatik G genau 2r Monomersequenzen hergestellt, so daB die Monomersequenzen fur 
die s dargestellten Symbole (Terminale und Variablen) und die Regeln R der Grammatik G 
eindeutig und zueinander moglichst unahnlich sind, sowie die geforderten strukturellen, 

10 chemischen und physikalischen Eigenschaften aufweisen. 

Die Monomersequenzen werden dazu nach dem NFR-Verfahren so hergestellt, daB sie wie 
im Folgenden beschrieben zu Algomeren zusammengesetzt werden konnen. Es werden dabei 
jeweils 2 Monomersequenzen zu einem Algomer zusammehgesetzt, das genau eine Regel R 
einer Grammatik G reprasentiert. Dabei enthalten beide Monomersequenzen jeweils 

15 Sequenzen. die die nach der Regel R erforderlichen zusammengehorenden Symbole 
(Terminale oder Variablen) enthalten. 

Der Entwurf der Oligomere nach Schritt III des erfindungsgemaBen Verfahrens ist abhangig 
von der chemischen Natur der eingesetzten Monomere. Im bevorzugten Fall der aus 
Nukleotiden aufgebauten Oligomere wird folgendermaBen vorgegangen: 
20 Algomere sind doppelstrangig und haben einen S'-Strang (Oberstrang) und einen 3'-Strang 
(Unterstrang). Oberstrang und Unterstrang konnen die Verknupfung jeweils einer Terminal- 
und einer Variablensequenz sein. 

Es seien X, Z beliebige Variablen, S eine Variable, die als Startsymbol fungiert, y, z beliebige 
Terminalsymbole. Dann wird fur jede Regel der Form: 
25 a) S:=yX 

ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die 
am 3'-Ende eine eindeutige einzelstrangige Uberhangsequenz X angehangt ist; ":=° bedeutet 
in diesem Fall, daB S und yX identisch sind, d.h. yX als Startermolekul fungiert. 

b) X->yZ 

30 ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die 
am S'-Ende eine eindeutige einzelstrangige Oberhangsequenz X und am 3'-Ende eine 
eindeutige einzelstrangige Uberhangsequenz Z angehangt ist. X kann dabei identisch mit Z 
sein. 

c) X->z 

35 ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz z enthalt, an die 
am 5'-Ende eine eindeutige einzelstrangige Uberhangsequenz X angehangt ist. 

Algomere der Form S := yX und X -> z heiBen Terminatoren ("Start", "Ende"), da sie zum 
Kettenabbruch wahrend der Polymerisation im erfindungsgemaBen Verknupfungsschritt V 
40 fuhren, der im Folgenden beschrieben wird; Algomere der Form X -> yZ heiBen Elongatoren, 
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weil sie zu einer Kettenverlangerung wahrend der Polymerisation im erfindungsgemaBen 
Verknupfungsschritt V fuhren. 

Vorzugsweise umfassen die in den Schritten tl und Hi des erfindungsgemaBen Verfahrens 
hergestellten Monomersequenzen Nukleotide, insbesondere Ribonukleotide, besonders 
5 bevorzugt Desoxyribonukleotide. Die in Schritt II des erfindungsgemaBen Verfahrens 
konstruierten Monomersequenzen konnen vorteilhafterweise bestimmte Sequenzen, z.B. 
Stopcodons, Erkennungssequenzen fiir Nukleinsauren spaltende Enzyme 

(Restriktionsnukleasen), Erkennungssequenzen fur Nukleinsaure-bindende Proteine u.a. 
enthalten, wie sie beisptelsweise in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular 
10 Cloning, A Laboratory Manual, (1989)], [Rolf Knippers, Molekulare Genetik, Georg Thieme 
Verlag, (1997)] und [Benjamin Lewin, Genes V, Oxford University Press, (1994)] beschrieben 
werden. 



15 Erlauterung zu IV: Algomer-Assemblierung 

Das Assemblieren der in Schritt HI synthetisierten Sequenzen erfolgt in Schritt IV des 
erfindungsgemaBen Verfahrens. Im Rahmen der vorliegenden Erfindung sind zur 
Durchfuhrung des Schrittes IV alle dem Fachmann bekannten Techniken, 
20 Oligomersequenzen zusammenzusetzen, einsetzbar. Im erfindungsgemaB bevorzugten Fall 
des Einsatzes von Nukleotidsequenzen ist es zweckmaBig folgendermaBen vorzugehen: 

a) Die zu Elongatoren gehorenden einzelstrangigen Sequenzen werden phosphoryliert. Dazu 
sind verschiedene dem Fachmann bekannte Protokolle moglich, z.B. das Folgende: 

25 In einem 20//I Ansatz werden 16//I einer synthetisierten 100//M Sequenz, 2$A Ugationspuffer 
(z. B. 50 mM Tris-HCI pH 7.5, 10 mM MgCI 2 , 10 mM Dithiothreitol. 1 mM ATP. 25//g/ml BSA 
Bovine Serum Albumin, New England Biolabs) und 2^1 PNK (Polynukleotidkinase, z.B. von 
New England Biolabs, Katalognr. #201 S Oder #201 L) 1 Stunde bei 37°C inkubiert. Volumina, 
Inkubationszeit und -temperatur konnen in dem Fachmann bekannter Weise variiert werden. 

30 b) Jeweils in einem Ansatz werden die zu einem Algomer gehorenden Einzelstrange (Ober- 
und Unterstrang) zu einem fertigen Algomer hybridisiert. Fur Elongatoren konnen einfach die 
Phosphorylierungsansatze von Ober- und Unterstrang verwendet werden. Fur die 
Hybridisierung sind mehrere Protokolle moglich; bevorzugt ist ein Denaturierungsschritt bei 
etwa 95°C zu Anfang (dieser deaktiviert gleichzeitig die PNK in den Ansatzen der 

35 Elongatoren) und eine langsame Hybridisierung. Z.B. kann fur Oligomere der Lange 30 
folgendes Protokoll verwendet werden, das gemaB den Kenntnissen des Fachmanns variiert 
werden kann: 

In einem 40//I Ansatz werden jeweils 20//I des Oberstranges (100//M) und 20//I des 
Unterstranges (100//M) in einem Thermozykler 5 Minuten auf 95°C erhitzt, 5 Minuten auf 72°C 
40 inkubiert und dann 25 Minuten jeweils 1 °C pro Minute abgekuhlt. 
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Erlauterung zu V: Herstellung von Logomeren durch Verkettung von Algomeren: 
Symbolpolymerisation 

In Schritt V des erfindungsgemaBen Verfahrens werden die Algomere zu langerkettigen, 
5 informationstragenden Polymeren (Logomeren) verknupft. Da Algomere die Regelmenge R 
einer Grammatik G darstellen, entsprechen alle dabei erzeugten Logomere Wortern der 
Sprache L(G), die durch die Grammatik G beschrieben wird. • 

Der geregelte ProzeB der Verkettung von Algomeren zu Logomeren wird als 
Symbolpolymerisation" bezeichnet, im Falle, daB die Terminalsymbole Bits reprasentieren, 
1 0 das heiBt, im Falle, daB gilt: 

S:= {0, 1, So, s 1a s 2 , Sn.1, s n , e 0 , e 1f e 2 , .... e m . 1f e m } mitn, m e IN und n, m > 0, 
wird der ProzeB als „Bitpolymerisation u bezeichnet. 

Im Rahmen der vorliegenden Erfindung sind zur Durchfuhrung des Schrittes V alle dem 
15 Fachmann bekannten Techniken, Oligomere zu Polymeren zu verknupfen, einsetzbar. Im 
erfindungsgemaB bevorzugten Fall des Einsatzes von Oligonukleotiden ist es zweckmaBig, 
die zu verknupfenden Algomere in Gegenwart von Ligase zu inkubieren. Beispielsweise kann 
nach folgendem Protokoll vorgegangen werden, das gemaB den Kenntnissen des Fachmanns 
variiert werden kann: 

20 In einem 27pl Ansatz werden 1/yl 50//M "StarT-Aigomer, 1//I 50//M "Ende w -Algomer und 2x 
jeweils 10/yl 40//M Elongator-Algomere (aus Schritt IV des erfindungsgemaBen Verfahrens 
erhalten), 1,5jt/l 10mM rATP und 3,5/vl T4 DNA Ligase mit 400 NEB Units///! (z.B. Katalognr. 
#202S und #202L NEB) zwischen 4°C und 25°C fur 2 bis 24Stunden inkubiert. 
Andere Reaktionsvolumtna funktionieren analog. Inkubationszeit und -temperatur konnen in 

25 dem Fachmann bekannter Weise variiert werden. 

Abbildung 3 zeigt das Resultat einer solchen Symbolpolymerisation. 

Es konnen dabei grundsatzlich beliebig viele Algomere, die keine Terminatoren sind, 
verknupft werden. Der Polymerisationsvorgang kommt fur jedes einzelne Logomer dann zu 
einem Stillstand, wenn das entsprechende Molekul an seinen Enden jeweils ein Algomer tragt, 
30 das als Terminatormolekul ("Start", "Ende") fungiert. 

Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung 

35 Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und 
Vervielfaltigung von informationstragenden Polymeren, die nach einem der vorhergehenden 
Anspruche erhalten wurden, das dadurch gekennzeichnet ist, daB man in Schritt V erhailtene 
informationstragende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen 
Vektoren transform iert und die erfolgreich transformierten Bakterien anhand von 

40 Selektionsmarkern selektioniert. 
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Erlauterung zu V: Herstellung von Logomeren durch Verkettung von Algomeren: 
Symbolpolymerisation 

In Schritt V des erfindungsgemaBen Verfahrens werden die Algomere zu langerkettigen, 
5 informationstragenden Polymeren (Logomeren) verknupft. Da Algomere die Regelmenge R 
einer Grammatik G darstellen, entsprechen alle dabei erzeugten Logomere Wortern der 
Sprache L(G), die durch die Grammatik G beschrieben wird. 

Der geregelte ProzeB der Verkettung von Algomeren zu Logomeren wird als 
Symbolpolymerisation" bezeichnet, im Falle, daB die Terminalsymbole Bits reprasentieren, 
10 das heiBt, im Falle, daB gilt: 

£:= {0, 1, s 0 , Si, s 2 , Sn-i, s n , e 0> e 1t e 2 , .... e^, e m } mit n, m e IN und n, m >0, 

wird der ProzeB als „Bitpolymerisation" bezeichnet. . 

i 

Im Rahmen der vorliegenden Erfindung sind zur Durchfuhrung des Schrittes V alle dem 
15 Fachmann bekannten Techniken, Oligomere zu Polymeren zu verknupfen, einsetzbar. Im 
erfindungsgemaB bevorzugten Fall des Einsatzes von Oiigonukleotiden ist es zweckmaBig, 
die zu verknupfenden Algomere in Gegenwart von Ligase zu inkubieren. Beispielsweise kann 
nach folgendem Protokoll vorgegangen werden, das gemaB den Kenntnissen des Fachmanns 
variiert werden kann: 

20 In einem 27//I Ansatz werden 1^/1 50//M "StarT-Aigomer, 1pl SOjjM "Ende n -Algomer und 2x 
jeweils 10//1 40a/M Elongator-Algomere (aus Schritt IV des erfindungsgemaBen Verfahrens 
erhalten), 1 f 5pl 10mM rATP und 3,5/yl T4 DNA Ligase mit 400 NEB Units///I (z.B. Katalognr. 
#202S und #202L NEB) zwischen 4°C und 25°C fur 2 bis 24Stunden inkubiert. 
Andere Reaktionsvolumina funktionieren analog, inkubationszeit und -temperatur konnen in 

25 dem Fachmann bekannter Weise variiert werden. 

Abbildung 3 zeigt das Resultat einer solchen Symbolpolymerisation. 

Es konnen dabei grundsatzlich beliebig viele Algomere, die keine Terminatoren sind, 
verknupft werden. Der Polymerisationsvorgang kommt fur jedes einzelne Logomer dann zu 
einem Stillstand, wenn das entsprechende Molekul an seinen Enden jeweils ein Algomer tragt, 
30 das als Terminatormolekul ("Start", "Ende") fungiert. 

Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung 

35 Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und 
Vervielfaltigung von informationstragenden Polymeren, die nach einem der vorhergehenden 
Anspruche erhalten wurden, das dadurch gekennzeichnet ist, daB man in Schritt V erhaltene 
informationstragende Polymere in Kionierungsvektoren ligiert, kompetente Zellen mit diesen 
Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von 

40 Selektionsmarkern selektioniert. 
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Uberstand aufnehmen und 200/^1 Chloroform zugeben, vortexen, bei 10000g 3 Minuten 
zentrifugieren 

Uberstand aufnehmen, mit 1/10 Vol. 3M NaAc ansauern und mit 2,5x Volumen 100% 
EtOH versetzen, vortexen, fur mindestens 15 Minuten auf -70°C 
5 - mindestens 15 Minuten auf 10000g zentrifugieren, Uberstand abnehmen und verwerfen 

mit ca. 500^1 70% EtOH waschen, fur 5-10 Minuten auf 10000g zentrifugieren, Oberstand 
abnehmen und verwerfen 

Pellet trocknen und in Aqua dest. wiederaufnehmen, so daB das geschnittene Plasmid mit 
100ng///l bis 1|/g///l vorliegt (hohere Konzentrationen sind auch moglich). Plasmid kann fur 
1 0 weitere Ligationen notigenfails verdunnt werden. 



b) Ligation des Logomers in den Klonierungsvektor 

Die in Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere und die 
praparierten Klonierungsvektoren werden ligiert. Durch die Art und Weise der Preparation ist 

15 gewahrleistet, daB moglichst nur die gewunschten Ligationen stattfinden: Die Terminatoren 
der Logomere tragen zwei verschiedene Uberhangsequenzen, die zu den durch Restriktion 
entstandenen Uberhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch konnen 
die Logomere nur in einer definierten Richtung in den Klonierungsvektor ligieren. AuBerdem 
sind die Terminatoren der Logomere nicht phosphoryliert, weshalb Logomere ausschlieBIich 

20 mit den Oberhangsequenzen des Klonierungsvektors ligieren konnen. Die Ligation erfolgt 
nach einem ublichen Ligationsprotokoil wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, 
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben, das gemaB den Kenntnissen 
des Fachmanns variiert werden kann, beispielsweise wie folgt: 

Das molare VerhSltnis Logomere/Klonierungsvektor kann z.B. 500 betragen, in 10j/I 
25 Gesamtvolumen werden: 

1 //I Plasmid (10ng///l = 5nM) 

0,5 //1 4//M Logomere aus Schritt V des erfindungsgemaBen Verfahrens 
1 //1 10x Ligationspuffer 
0,5 jj\ T4 DNA Ligase (400u///l) 
30 7//I H 2 0 

fur 12 Stunden auf 16°C ligiert. 

Das Protokoll kann gemaB den Kenntnissen des Fachmanns variiert werden. Z.B. ist es 
moglich, ein Protokoll zur TCL (Temperature Cycle Ligation, [Lund, A.H., Duch, M„ Pedersen, 
F.S, Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: 
35 (4), 800-801 , (1 996)]) zu verwenden. 

Der erhaltene Ligationsansatz wird nun fur die Transformation kompetenter Zellen verwendet, 
wie nachfolgend beispielhaft gezeigt: 

c) Transformation kompetenter Zellen 

Die Transformation von Bakterien (kompetente Zellen, Hoststamm z.B. dHSa, GIBCO BRL, 
40 Katalog Nr.: 18258-012) mit dem Ligationsansatz aus b) erfolgt nach einem der ublichen 
Protokolle, wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A 
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Oberstand aufnehmen und 200^1 Chloroform zugeben, vortexen, bei 10000g 3 Minuten 
zentrifugieren 

Oberstand aufnehmen, mit 1/10 Vol. 3M NaAc ansauern und mit 2,5x Volumen 100% 
EtOH versetzen, vortexen, fur mindestens 15 Minuten auf -70°C 
5 - mindestens 15 Minuten auf 10000g zentrifugieren, Oberstand abnehmen und verwerfen 

mit ca. 500/il 70% EtOH waschen, fur 5-10 Minuten auf 10000g zentrifugieren, Oberstand 
abnehmen und verwerfen 

Pellet trocknen und in Aqua dest. wiederaufnehmen, so daB das geschnittene Plasmid mit 
100ng///i bis 1//g///i vorliegt (hdhere Konzentrationen sind auch mogiich). Plasmid kann fur 
1 0 weitere Ligationen notigenfalls verdunnt werden. 

b) Ligation des Logomers in den Klonierungsvektor 

Die in Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere und die 
praparierten Klonierungsvektoren werden ligiert. Durch die Art und Weise der Preparation ist 

15 gewahrleistet, daB moglichst nur die gewunschten Ligationen stattfinden: Die Terminatoren 
der Logomere tragen zwei verschiedene Oberhangsequenzen, die zu den durch Restriktion 
entstandenen Oberhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch konnen 
die Logomere nur in einer definierten Richtung in den Klonierungsvektor ligieren. AuBerdem 
sind die Terminatoren der Logomere nicht phosphoryliert, weshalb Logomere ausschlieBlich 

20 mit den Oberhangsequenzen des Klonierungsvektors ligieren konnen. Die Ligation erfolgt 
nach einem ublichen Ligationsprotokoll wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, 
Molecular Cloning, A Laboratory Manual, (1989)] beschrieben, das gemaB den Kenntnissen 
des Fachmanns variiert werden kann, beispielsweise wie folgt: 

Das molare Verhaltnis Logomere/Klonierungsvektor kann z.B. 500 betragen, in 
25 Gesamtvolumen werden: 

1 //I Plasmid (10ng///l = 5nM) 

0,5 //I 4//M Logomere aus Schritt V des erfindungsgemaBen Verfahrens 
1 //1 10x Ligationspuffer 
0,5 j/l T4 DNA Ligase (400u///l) 
30 7/j\ H 2 0 

fur 12 Stunden auf 16°C ligiert. 

Das Protokoli kann gemaB den Kenntnissen des Fachmanns variiert werden. Z.B. ist es 
mogiich, ein Protokoli zur TCL (Temperature Cycle Ligation, [Lund, A.H., Duch, M., Pedersen, 
F.S, Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: 
35 (4), 800-801 , (1 996)]) zu verwenden. 

Der erhaltene Ligationsansatz wird nun fur die Transformation kompetenter Zellen verwendet, 
wie nachfolgend beispielhaft gezeigt: 

c) Transformation kompetenter Zellen 

Die Transformation von Bakterien (kompetente Zellen, Hoststamm z.B. dH5o, GIBCO BRL, 
40 Katalog Nr.: 18258-012) mit dem Ligationsansatz aus b) erfolgt nach einem der ublichen 
Protokolle, wie z.B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A 
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Laboratory Manual, (1989)] beschrieben wird und das gemaB den Kenntnissen des 
Fachmanns variiert werden kann, z.B. wie folgt: 

- 200//I kompetenter Zeilen (- 5x1 0 7 CFU = Colony Forming Units, bei -70°C gelagert) 
werden aufgetaut und auf Eis gestellt 

Etwa 1ng des Ligationsansatzes aus b) wird dazu pipettiert und 20-30 Minuten auf Eis 
stehen gelassen, alle 5 Minuten vorsichtig mixen 
Hitzeschock: Ansatz 2 Minuten auf 42°C, zuruck auf Eis 

- 0,8ml LB-Medium (+ 0,02M MgS0 4 + 0,01 M KCI) zugeben 
Ansatz 20-60 Minuten im Reagenzgias auf 37°C rollen 

0,1 - 1 ml auf Agarplatte (mit Antibiotikum, z.B. Ampicillin) ausplattieren und Uber Nacht 
auf 37°C 

Die Transformation fungiert dabei als Selektionsverfahren auf erfolgreich klonierte Logomere 
und als Isolationsverfahren einzelner Logomere, weil jede Bakterienzelle genau ein Plasmid 
exprimiert. 

AuBer dem genannten Verfahren der Klonierung, das erfindungsgemaB bevorzugt ist, konnen 
die in Schritt V des erfindungsgemaBen Verfahrens erhaltenen informationstragenden 
Polymere (Logomere) mit folgenden Verfahren isoliert und vervielfaltigt werden: 



20 Isolation durch Hybridisierung und chromatographische Methoden 

Hierbei wird das aus einer Symbolpolymerisation erhaltene MoIekQlgemisch uber ein 
Tragermaterial gegeben, an das Oligomere ("Ankersequenzen") gebunden sind, die ihrerseits 
an die Terminatoren der Logomere binden konnen. Die gebundenen Logomere werden dann 
einzeln aufgenommen und konnen nach Bedarf vervielfaltigt werden. 

25 Es sind hierzu yerschiedene Verfahren einsetzbar: 

a) Affinitatschromatographie; dabei werden Ankersequenzen, die zu den uberhangenden 
Enden der Terminatoren kompatible Enden besitzen, z.B. an eine Hydroxylapatit-Saule 
gebunden. Die aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen Logomere 
werden uber die Saule gegeben, wodurch die Logomere durch Hybridisierung an die 

30 Ankersequenzen binden konnen. Die solcherart gebundenen Logomere werden dann 

einzeln aufgenommen. 

b) Ankersequenzen werden an eine Membran (z.B. Gene Screen Plus, DuPont, 
Biotechnology Systems; Hybond-N, Amersham Life Sciences) kovalent gebunden. Die 
Membran ist gerastert, d.h. in einzelne Felder unterteilt. Pro Feld wird genau eine 

35 Ankersequenz kovalent an die Membran gebunden. Danach werden die aus Schritt V des 

erfindungsgemaBen Verfahrens erhaltenen Logomere uber die Membran gegeben und 
mit den Ankersequenzen hybridisiert. Die Membran wird daraufhin in die einzelnen Felder 
des Rasters zerschnitten. Die einzelnen Felder, die nun maximal ein an die jeweilige 
Ankersequenz gebundenes Logomer enthalten, konnen jetzt in separate GefaBe (z.B. 

40 Eppendorf Tubes) uberfuhrt werden. Sodann konnen die Logomere durch Denaturieren 

von der Membran getrennt werden. Beim Denaturieren ist zu beachten, daB die 
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Denaturierungstemperatur so gewahlt ist, daB sie hoch genug ist, um Logomer und 
Ankersequenz zu trennen, jedoch nicht so hoch, daB das Logomer selbst vollstandig 
aufschmilzt. 



5 Isolation durch Verdunnung 

Bei der isolation durch Verdunnung werden die Logomere, die als Gemisch aus einer 
Symbolpolymerisation erhalten werden, soweit verdunnt, daB in einem jeweiligen Zielvolumen 
statistisch genau ein Molekul enthalten ist. Dieses kann dann mit Hilfe der PCR aufgespurt 
und vervielfaltigt werden. Die Verdunnung des Ausgangsvolumens in Zielvolumina kann dabei 
10 gleichzeitig geschehen, so daft ein Ausgangsvolumen auf n Zielvolumina verdunnt wird. 
Dazu wird erfindungsgemaB wie folgt vorgegangen: 

Zu einem, aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen, Gemisch von 
Logomeren in einem Ausgangsvolumen V a wird ein Verdunnungsfaktor ermittelt, der n in V a 
enthaltene Logomere so auf n Zielvolumina V 2 verdunnt, daB in jedem Zielvolumen V 2 

15 statistisch genau ein Logomer enthalten ist. Um den Verdunnungsfaktor zu ermitteln wird ein 
Aliquot des Ausgangsvolumens (z.B. 1/il) in einer Verdunnungsreihe austitriert. Von jeder 
Verdunnung der Reihe wird dann ein Aliquot (z.B. 1/il) als Template einer PCR-Reaktion 
verwendet, um zu ermitteln, in welchen Verdunnungen noch Logomere detektierbar sind. 
Erhalt man solcherart die letzte Verdunnung, die noch Logomere enthalt, und die Verdunnung, 

20 die schon keine mehr enthalt, laBt sich ein ungefahrer Verdunnungsfaktor angeben, der 
gerade noch ungefahr ein Logomer enthalt. Gegebenenfalls kann dieser Verdunnungsfaktor 
durch Austitrieren der letzten Verdunnung, die noch Logomere enthalt, genauer bestimmt 
werden. Dabei verwendet man entsprechend kleinere Verdunnungsschritte (verdunnt man 
z.B. in der ersten Verdunnungsreihe immer 1:10, so kann man in der 2. Verdunnungsreihe z.B 

25 1:2 verdunnen; das Verfahren der genaueren Bestimmung des Verdunnungsfaktors kann 
dabei prinzipiell mit beliebiger Genauigkeit angewendet werden). 

Da die PCR der Verdunnungen dazu dient, festzustellen, ob sich uberhaupt noch Logomere in 
der Verdunnung befinden, kann die PCR auf mindestens zweierlei Weise durchgefuhrt 
werden: 

30 a) Als Primer dienen zwei gegenlaufige, in den Terminatoren primende Primer, z.B. der 5'- 
Strang des Start-Terminators und der 3'-Strang des Ende-Terminators. Ansonsten sind 
die PCR-Bedingungen wie weiter unten unter Vervietfaltigung von Logomeren durch PCR 
beschrieben. 

b) Die PCR wird wie die zum Auslesen der Logomere durchgefuhrt, es reicht jedoch ein 
35 Ansatz mit einem Paar von Primern wie unter Auslesen von Logomeren mrttels PCR im 

Folgenden beschrieben. 
Zur Kontrolle werden die durch PCR erhaltenen DNA Fragmente durch Gelelektrophorese 
sichtbar gemacht. Dazu wird z.B. ein 2-4%iges Agarose-Gel (z.B. UltraPure™ von Gibco BRL, 
Life Technologies, Katalog Nr.: 15510-027) und als Molekulargewichtsstandard z.B. eine 
40 50bp-Leiter (Gibco BRL, Life Technologies, Katalog Nr. 10416-014) verwendet. Das erhaltene 
Gel wird 5 Minuten in 0,001% Ethidiumbromid gefarbt und unter UV sichtbar gemacht. 
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Vervielfaltigung von Logomeren 



PCT/EPOO/02893 



Die aus einer Symbolpolymerisation erhaltenen Logomere konnen - je nach ihrer 
beabsichtigten Verwendung - vervielfaltigt werden. Dies ist beispielsweise fur die 
b Visualisierung der gespeicherten Information Oder die Weiterverwendung der Logomere als 
Marker zur Kennzeichnung von Stoffen und Gegenstanden notig. 

Vervielfaltigung von Logomeren durch PCR 

10 

Bei diesem Verfahren werden Logomere durch PCR vervielfaltigt. Das zu vervieifaltigende 
Logomer dient als Template, die benotigten Primer primen jeweils gegenlaufig in den 
Terminatoren (entweder 5'-Start und 3'-Ende, Oder 5'-Ende und 3'-Start), so daB das Logomer 
vollstandig vervielfaltigt wird. Alternativ konnen die Primer, sofern das zu vervieifaltigende 
Logomer von weiterer DNA umgeben ist, auch weiter auBerhalb des Logomers primen. 

1 5 

Fur die PCR-Ansatze, die in dem Fachmann bekannter Weise variiert werden konnen, 
werden z.B. folgende Reagentien und Bedingungen verwendet: 

dNTPs (z.B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z.B. Gibco- 
2Q BRL , Katalog Nr.n: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCI 2 (z.B. GIBCO- 
BRL, Katalog Nr.: 1 8067-01 7) 
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Menge 


dNTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCI 2l 25mM 


5 


TAQ, 5U///I 


0,5 


Primer 1, 10//M 


1 


Primer 2, 10/yM 


1 


Template 


1 


(Logomer) 




H 2 0 


35,5 


Gesamtvolumen 


50 



Als PCR-Programm kann beispielsweise folgendes Protokoll (Primer: 30-mere) verwendet 
werden: ! 

Dauer 



Schritt Aktion 



Temperatur 



Gehe zu 
Schritt 



Anzahl 
Wiederholungen 



1 Denaturiere 

2 Denaturiere 

3 Annealing 

4 Polymerisation 

5 Gehe zu 

6 Kuhlen 

7 Ende 



95 °C 00:05:00 

95 °C 00:00:30 

68 °C 00:00:30 

72 °C 00:00:30 

4°C (beltebig) 



29 



Ein weiterer Gegenstand der Erfindung sind informationstragende Polymere, die gemaB den 
oben beschriebenen erfindungsgemaBen Verfahren erhattlich sind. 



Auslesen der in Logomeren enthaltenen Information 

10 

Fertige Logomere konnen entweder mittels PCR (Polymerase Chain Reaction = 
Polymerasekettenreaktion), was erfindungsgemaB bevorzugt ist, oder mittels 
Restriktionsverdau gelesen werden. Dabei hat die PCR-Methode den Vorzug, bereits 
geringste Mengen DNA solcherart vervielfaltigen zu konnen, daft die Logomere direkt nach 
15 der PCR und einer Gel-Auftrennung gelesen werden konnen. Im Falle von binaren Logomeren 
kann das durch die PCR-Methode auf einem Gel erhaltene Bandenmuster unmittelbar als 
Binarcode gelesen werden. 

Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zum Auslesen von Information 
aus informationstragenden Polymeren, die wie oben beschrieben erhalten und/oder isoliert 
20 und vervielfaltigt wurden, dadurch gekennzeichnet, daB man 
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a) n das informationstragende Polymer enthaltende Losungen mit jeweils einem Paar 
gegenlaufiger Primer versetzt, wobei n fur die Zahl der als Elongatoren in dem 
Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in 
5 dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares 

in dem dem Elongator gegenuberliegenden Terminator primt und der andere Primer 
in dem Elongator selbst primt; 

c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Lange durch 
Elektrophorese auftrennt und 

1 0 d) das aus der Elektrophorese erhaltene Muster optisch ausliest. 

Das Verfahren kann auch unter Verwendung verschiedenfarbiger fluoreszenzmarkierter 
Primer oder Nukleotide durchgefuhrt werden. Dadurch wird es moglich, mehrere Ansatze 
verschiedenfarbig zu markieren und mehrere Ansatze in einer Spur gelelektrophoretisch zu 
lesen. Uberdies kann der AusleseprozeB dadurch mit modernen Sequenziermaschinen (z.B. 

1 5 von ABl erhaltlich) automatisiert werden. 



Auslesen von Logomeren mittels PCR 

Urn die in Logomeren enthaltenen Informationen sichtbar zu machen, konnen die Logomere 
mithilfe der PCR ausgelesen werden. 

Die Methode des Auslesens binarer Muster mit PCR wurde als DAW Typing bereits von 
[Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204- 
209, (1991)] beschrieben. Die dort beschriebene Methode wird hier in einer abgewandelten 
Form als Auslese-PCR zum Auslesen der Logomere benutzt. Unterschiede zu der in [Jeffreys, 
Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)] 
beschriebenen Methode bestehen darin, daB hier synthetisch erzeugte Templates verwendet 
werden, die nicht notwendig binare Muster enthalten. AuBerdem werden PCR- und Gel- 
Elektrophorese-Bedingungen so gewahlt, daB das Ergebnis direkt vom Gel gelesen werden 
kann, ohne daB die als Bandenmuster erhaltenen Signale zusatzlich durch Blotting verstarkt 
werden mussen. 



a) PCR 

Fur das Auslesen eines Logomers werden fur n Elongatoren der zugrundeliegenden 
Grammatik mindestens n - 1 , meistens aber n PCR-Ansatze gebraucht. Jeder PCR-Ansatz 
enthalt das zu lesende Logomer als Template und auBerdem ein Paar gegenlaufiger Primer, 
von denen einer im Elongator, der andere im, dem Elongator gegenuberliegenden, Terminator 
primt (z.B. 5'-"Start" und 3'-0, siehe Abbildung 5). Fur die PCR kann jeder handelsubliche 
Thermozykler (z.B. PTC-100, MJ Research) verwendet werden. Als zweckmaBig fur die 
Lange der Primer haben sich 20-30bp erwiesen, jedoch sind auch andere Langen 
verwendbar. Je nach Primerlange muB die Annealing-Temperatur entsprechend gewahlt 
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werden (kann z.B. mithilfe des Programmes Oiigo 5.0 bestimmt werden). ZweckmaBige 
Annealingtemperaturen sind fur 20-mere ca. 55°C, fur 30-mere etwa 65°C bis 74 °C. 
Fur die PCR-Ansatze werden z.B. folgende Reagentien und Protokolle verwendet, die in dem 
Fachmann bekannter Weise variiert werden konnen: 

dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (Gibco-BRL, 
Katalog Nr.n: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCI 2 (GIBCO-BRL, Katalog 



Nr.: 18067-017) 


Menge (p\) 


dNTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCI 2 , 25mM 


5 


TAQ, 5U///I 


0,5 


Primer 1, 10/yM 


1 


Primer 2, 10//M 


1 


Template 


1 


(Logomer) 




H 2 0 


35,5 


Gesamtvolumen 


50 



Urn genugend DNA zu erhalten, so da8 das erhaltene Bandenmuster nach der 
Gelelektrophorese direkt vom Gel gelesen werden kann, kann jeder PCR-Ansatz m mal 
angesetzt werden. Z.B. kann m = 4 sein. 

Als PCR-Programm kann folgendes Protokoll (Primer: 30-mere) verwendet werden: 
Schritt Aktion Temperatur Dauer Gehezu Anzahl 

Schritt Wiederholungen 



1 


Denaturiere 


95 °C 


00:05:00 


2 


Denaturiere 


95 °C 


00:00:30 


3 


Annealing 


69,5 °C 


00:00:30 


4 


Polymerisation 


72 °C 


00:00:30 


5 


Gehe zu 






6 


Kuhlen 


4 °C 


(beliebig) 


7 


Ende 







Nach durchgefuhrter PCR ist es fur die Lesbarkeit der Bandenmuster der nachfolgenden 
Gelelektrophorese evtl. zweckmaBig, moglichst viel amplifizierte DNA in moglichst geringem 
Volumen zu halten, das dann auf ein Gel geladen werden kann. Dazu konnen die Volumina 
auf geeignete Weise (z.B. mit einer SpeedVac, z.B. SpeedVac Concentrator, Savant) 
eingeengt werden. 
b) Gelelektrophorese 
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Die fur jeden Elongator aus der PCR erhaltenen DNA Fragmente haben verschiedene Lange. 
Werden sie durch Elektrophorese aufgetrennt, so ergeben die unterschiediichen 
Langenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer 
identifizieren laBt (siehe Abbildung 5 und Abbildung 6). Fur die Gelelektrophorese kann ein 
5 4% Agarose-Gel (z.B. UltraPure™ von Gibco BRL ( Life Technologies, Katalog Nr.: 15510- 
027), ais Molekulargewichtsstandard z.B. eine 50bp-Leiter (Gibco BRL, Life Technologies, 
Katalog Nr.: 10416-014) verwendet werden. Die Auftrennung der DNA erfolgt in einer 
Gelkammer in geeigneter Weise, z.B. 1 :45 Stunden bei 60V. Hier sind die Parameter jedoch 
relativ trei wahibar, insbesondere kann die Gel-Laufzeit weiter verkurzt werden. 
10 Das erhaltene Gel wird 5 Minuten in 0,001% Ethidiumbromid gefarbt und unter UV sichtbar 
gemacht. 

Ein Beispiel fur ein solcherart erhaitenes Gel findet sich exemplarisch unter Abbildung 6. 

I 

I 

Auslesen von Logomeren durch Restriktionsverdau 

15 

Logomere konnen durch Restriktionsverdau ausgelesen werden. Dazu mussen die 
Elongatoren so konstruiert sein, daB sie asymmetrisch versetzte Restriktionsschnittsteilen 
tragen. Jeder Elongator tragt dabei eine spezifische Restriktionsschnittstelle. Beispielsweise 
kann das Restriktionsenzym EcoRV (z.B. NEB, Katalog Nr. #195S) fur O-Elongatoren und 

20 Smal (z.B. NEB, Katalog Nr. #1 41 S) fur 1 -Elongatoren verwendet werden. 

Zum Lesen wird das zu lesende Logomer in verschiedenen Restriktionsansatzen geschnitten. 
Dazu wird pro Elongator ein Restriktionsansatz mit dem jeweiligen Restriktionsenzym gebildet. 
Die aus der Restriktion erhaltenen DNA Fragmente sind von verschiedener Lange. Werden 
sie durch Elektrophorese aufgetrennt, so ergeben die unterschiediichen Langenfragmente ein 

25 spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren laBt. 

Das folgende Beispiel zeigt die DNA-Fragmentlangen aller binaren Logomere mit 4 Bit ohne 
Terminatoren mit Elongatorlange = 30bp; Restriktionsschnittstelle pro Elongator nach 10bp. 
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Binarzahl q 1 

0000 1Q 40 4 0 4Q 30 16Q 

0001 10,40,40,70 130,30 

0010 10,40,80,30 90,70 

0011 10, 40, 110 90, 40, 30 

0100 10,80,40,30 50,110 

0101 10, 80, 70 50, 80, 30 

0110 .10,120,30 50,40,70 

0111 10,150 50, 40, 40, 30 

1000 50,40, 40, 30 10, 150 

1001 50,40,70 10,120,30 

1010 50,80,30 10,80,70 

1011 50,110 10,80,40,30 * j 

1100 90,40,30 . 10,40,110 

1101 90,70 10, 40, 80, 30 * 1 

1110 130.30 10,40, 40, 70 

1111 160 10, 40, 40, 4 0, 30 

Im obigen Beispiel (4 Bits) erkennt man, daB die Langenmuster der Zahlen 0010 und 0100 bei 
Restriktion des 0-Bits nicht eindeutig ist. 0010 und 0100 lassen sich jedoch anhand der 
Langenmuster bei Restriktion des 1-Bits unterscheiden. 

Im Einzelnen wurde zur Durchfuhrung des obigen Beispiels folgendermaGen vorgegangen, 
wobei sich die Protokolle gemaB den Kenntnissen des Fachmanns variieren lassen: 

a) DNA Extraktion 

Eine z.B. durch Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung erhaltene 
Bakterienkolonie wird zum Animpfen von 2-5ml einer 37°C Ubernachtkultur verwendet (z.B. 
LB-Medium mit 10//g/l Ampicillin wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular 
Cloning, A Laboratory Manual, (1989)] beschrieben). Als Klonierungsvektor konnen hier z.B. 
pGEM-T Easy (Promega, Katalog Nr. A1360) und binare Logomere auch ohne Terminatoren 
verwendet werden. Aus der Ubernachtkultur wird die das Logomer enthaltende Plasmid-DNA 
isoliert (z.B. mithilfe des Qiagen Plasmid Miniprep Kit, Qiagen, Katalog Nr. 12123, oder durch 
alkalische Lyse wie in [J. Sambrook. E. F. Fritsch, T. Maniatis, Molecular Cloning, A 
Laboratory Manual, (1989)] beschrieben). 

b) Restriktion 

Die aus a) erhaltene Plasmid DNA wird fur n Elongatoren in n Restriktionsansatzen 
geschnitten. Jeder Restriktionsansatz enthalt ein Restriktionsenzym, das in einem 
spezifischen Elongator schneidet und ein Restriktionsenzym, das das Logomer aus der 
Klonierungssite ausschneidet. Im verwendeten Beispiel wurden folgende Ansatze verwendet: 

Name Menge Volumen 

Plasmid Logomer in pGEM-T 500ng///l 6 
DNA Easy (s.o.) 

Puffer NEB2 10x 1 
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BSA 10x 1 

Enzym 1 Eco R V 1 0u//vl 1 

Enzym 2 Eco Rl 10u//y| 1 

Total 10 





Name 


Menge 


Volumen 


Plasmid 


Logomer in pGEM-T 500ng///l 


6 


DNA. 


Easy (s.o.) 






Puffer 


NEB4 


lOx 


1 


BSA 




10x 


0 


Enzym 1 


Sma I 


10u//y| 


1 


Enzym 2 


Eco Rl 


10u//yl 


1 


H 2 0 






1 


Total 






10 



I 



Die angegebenen Ansatze werden 1 Stunde auf 37°C inkubiert. 
c) Gelelektrophorese 

5 Die aus b) erhaltenen DNA Fragmente werden elektrophoretisch aufgetrennt (z.B. 4% 
Agarose UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027). mit 
Ethidiumbromid (0,001%) gefarbt und unter UV sichtbar gemacht (siehe Abbildung 8). 



10 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
binarer Logomere: 

Binare Logomere werden mit Grammatiken erzeugt, in denen gilt: 
Z:= {0, 1, s 0l s 1( s 2 , .... Sm, s n , e 0 , e 1t e 2 , .... em. 1t ej mit n, m e IN und n, m >0. 
15 Sie ermoglichen die einfachste und universellste Darstellung von Daten, wie sie auch von 
herkommlichen Datenverarbeitungsmaschinen eingesetzt wird. Binare Logomere sind 
Resultat einer Bitpolymerisation. Da abhangig von der jeweils gewahlten Grammatik nahezu 
beliebige Symbole und Regeln kodiert werden konnen, konnen damit ebenso beliebige Daten 
und Datentypen erzeugt werden. 

20 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
von Zeichenalphabeten: 

Logomere konnen eingesetzt werden, urn die Zeichen eines gewahlten Alphabetes zu 
5 kodieren. Die Zeichenlange kann dabei unterschiedlich gewahlt werden, sinnvoll ist es jedoch, 
die auch fur herkommliche Datenverarbeitungsanlagen benutzten Zeichenlangen (Halbbyte, 
1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konvention fur die 
Interpretation der dargestellten Zeichen wahlfrei. Die Zeichen konnen Zahlen, Buchstaben, 
alphanumerische Zeichen Oder beliebige andere Datenstrukturen sein. 

10 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
eines 1-Byte Alphabetes: 

Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet Z:= {0, 1 , s, e}, Variablenmenge 
15 V:-{ S 0f S u S 2 , S 3 , S 4f S 5 , S 6 , S 7t S 8 }, Startsymbo! S und Regelmenge 

R:= 
{ 

S:=sS 0 
S 0 ->0Si 
20 So^ISt 
S,->0S 2 

S 2 ->0S 3 

5 2 - >1S 3 
25 S 3 ->0S 4 

5 3 - >1S 4 

5 4 - >0S 5 

5 4 - >1S 5 

5 5 - >0S 6 
30 S 5 ->1S 6 

5 6 - >0S 7 

5 6 - >1S 7 
St->0S 8 

5 7 - >1S a 
35 S 8 ->e 

} 

wobei: 
s := Start 
e := Ende. 
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Beispiei: 

nach den Regeln der angegebenen Grammatik konnen alle 8-Bit Zeichen erzeugt werden: 
z.B.: Erzeugung der 8-Bit 0, 00000000: 

S-> sS 0 -> sOS, -> S00S 2 -> s000S 3 -> SOOOOS4 -> SOOOOOS5 -> sOOOOOOSe -> s0000000S 7 -> 
5 sOOOOOOOOSe -> sOOOOOOOOe 

z.B.: Erzeugung der 8-Bit 255, 11111111: 

S-> sS, -> s1 S, -> s1 1 S 2 -> s1 1 1 S 3 -> s1 1 1 1 S 4 -> s1 1 11 1 S 5 -> s1 1 1 1 11 S 6 -> s1 1 1 11 1 1 S 7 -> 
s111111HS 8 ->s11111111e 
z.B.: Erzeugung der 8-Bit 85 f 01010101: 
10 S-> sS 0 -> sOS, -> s01S 2 -> SOIOS3 -> SOIOIS4 -> SOIOIOS5 -> s010101S 6 -> sOIOIOIOSy -> 
s01010101S 8 -> sO1010101e 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren f 
wie in den erfindungsgemaBen Schritten il und III beschrieben, hergestellt. Algomere und 

15 Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergestellt 
und die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und 
Vervielfaltigung von Logomeren durch Kionierung beschriebenen Verfahrens isoliert und 
vervielfaltigt. Die soicherart erzeugten alphanumerischen Zeichen konnen jetzt fur 
verschiedene technische Zwecke (z.B. die Markierung und Identifizierung von Stoffen) 

20 eingesetzt werden und. evtl. nach zusatzlichen technischen Schritten, gemaB dem 
erfindungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden 
Polymeren (wie oben beschrieben) ausgelesen werden. 

Da die hier erzeugten Binarmuster wahlfrei als Daten und Symbole gelesen werden konnen, 
konnen sie z.B als alphanumerische Zeichen interpretiert werden. Werden sie als Zahlen 
25 interpretiert, so erzeugt die angegebene Grammatik 8-Bit Zufallszahlen. 

Aus einer genugend groBen Menge zufalliger 8-Bit Binarmuster konnen alle 8-Bit Muster 
isoliert und als Bibliothek (z.B. zur Darstellung aller alphanumerischen Zeichen) angelegt 
werden. 

30 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Darstellung von 
Zeichenketten: 

Da Algomere so hergestellt werden konnen, daB sich unterschiedlich lange Logomere 
35 erzeugen lassen, ist es moglich, auch Zeichenketten darzustellen. Aus praktischen Grunden 
ist es jedoch zweckmaBig, nur wenige Zeichen pro Logomer vorzusehen. Z.B. kann ein 
einzelnes Logomer 4 Bit (Halbbyte) Oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich 
sind, sollten zweckmaGigerweise immer Vielfache von 8 Bit = 1 Byte verwendet werden.) In 
Binardarstellung konnen dann beliebige alphanumerische Zeichen in beliebiger Kodierung 
40 (z.B. ASCII, ANSI, ISO 8859-x, Unicode) dargestellt werden. Dabei kann sich ein Zeichen 
auch Ciber mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich jeweils ein 
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1-Byte Zeichen uber zwei Logomere erstreckt, Oder Unicode, bei der sich ein 16-Bit Zeichen 
uber zwei 8-Bit Oder vier 4-Bit Logomere erstreckt). Fur die Darstellung von Zeichenketten ist 
es dann notig, die einzelnen Zeichen mit Positionsinformation zu versehen. Dazu reicht es, in 
den jeweiligen Grammatiken verschiedene Terminatoren (z.B. verschiedene "Start"- 
5 Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation 
reprasentieren. 

Beispiel: Es sei eine Grammatik G = (X, V, R, S) mit Terminalalphabet Z:= {0, 1, e, s 0 , Si, s 2 , 
... Sn.,, s n }, Variablenmenge V:={ S 0 , Si, S 2 , S 3 , S 4 , S 5 , S 6 , S 7 , S 8 }, Startsymbol S und 
Regelmenge 

10 R:= 
{ 

Si=SjSo 
So^OS! 

5 0 - >1Si 
15 S 1 ->0S 2 

5 1 - >1S 2 

5 2 - >0S 3 

5 2 - >1S 3 

5 3 - >0S 4 
20 S 3 ->1S 4 

5 4 - >0S 5 

5 4 - >1S 5 

s 5 ->os 6 

5 5 - >1S 6 
25 S 6 ->0S 7 

5 6 - >1S 7 

5 7 - >0S 8 

5 7 - >1S 8 

5 8 - >e 

30 } 

wobei: 

Sj := Start, mit i = {0, .... n} 
e := Ende. 

35 Das mit dieser Grammatik erzeugte 1-Byte Alphabet reicht z.B. fur alle alphanumerischen 
Zeichen des ASCII, ANSI Oder ISO 8859-x Standards. Fur eine Zeichenkette der Lange n 
werden n verschiedene Terminatoren benotigt, so daB die mit dieser Grammatik erzeugten 
Zeichenketten wie folgt aufgebaut sind: 
Soxe, SiXe, s,vixe, SnXe 

40 wobei x eine beiiebige Binardarstellung mit, in diesem Fall, 8 Bit ist. 
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Es bedeutet dann: 

s 0 xe := Zeichen x an Position 0 (O.tes Zeichen) 
s,xe := Zeichen x an Position 1 (l.tes Zeichen) 
s 2 xe := Zeichen x an Position 2 (2.tes Zeichen) 
5 usw. 

Mit der Grammatik laBt sich beispielsweise die Zeichenkette "Elisabeth" im ASCII-Code 
darstellen: 

s 0 01000101e, StOHOHOOe, s 2 01101001e, s 3 01110011e, s 4 011 00001 e, s 5 01100010e, 
s 6 01100101e, s 7 0i liOIOOe, s 8 01101000e 
10 Alternativ kann auch Z:= {0, 1, s, e 0 , e,, e 2 , e frli e n } gewahlt werden, wodurch die 
Zeichenkette "Elisabeth" im ASCII-Code als: 

s01000101e 0f s01101100e 1t s01101001e 2t s01110011e 3 , s01 1 00001 e 4 , s01100010e 5 , 
s01 1 001 01 e 6 , s01 1 1 01 00e 7 , s01 1 01 000e 8 

dargestellt wird. Eine weitere Moglichkeit ist Z:= {0, 1, s 0 , s„ s 2 , .... s n .i, s n . e 0 , e u e 2 , .... e^, 
1 5 e n }, womit die Zeichenkette "Elisabeth" im ASCII-Code als: 

s 0 01000101e 0 , s,01101100ei, s 2 01 1 01 001 e 2 , s 3 01110011e 3 , s 4 01 100001 e 4 , s 5 01 1 0001 0e 5 , 
s 6 01 1 001 01 e 6f s 7 01 1 1 01 OOey, s 8 01 1 01 000e 8 
dargestellt wird. 

In Halbbyte-Darstellung mit Positionsinformation wurde die Zeichenkette "Elisabeth" im ASCII- 
20 Code dargestellt als : 

s 0 0100e, St0101e, s 2 0110e, s 3 1100e p s 4 0110e, s 5 1001e, s 6 0111e, s 7 0011e, s 8 0110e, s 9 0001e, 
s lo 0110e, Sn0010e t s 12 0110e, s 13 0101e, s 14 0111e, s 15 0100e, s i6 0110e, s 17 1000e 

Aufgrund der Positionsinformation, die durch die Sequenz der Terminatoren reprasentiert 
25 wird, konnen die einzelnen Zeichen voliig unabhangig voneinander verarbeitet werden und 
z.B. getrennt voneinander gelesen werden. 

Mit einem solchen Alphabet ist die Darstellung beliebiger Datentypen moglich. Z.B. konnen 

z.B. jeweils zwei Byte (0. + 1., 2. + 3 , n. + n+1.) zu einem 2-Bytecode (z.B. Unicode) 

zusammengefaBt werden. Alphanumerische Zeichenketten konnen verwendet werden, urn 
30 beliebige Bezeichner (Namen, Zahlen, Datum usw.) darzustellen. 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, 
wie in den erfindungsgemaBen Schritten II und III beschrieben, hergesteilt. Algomere und 
Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergesteilt, 

35 die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervietfaltigung 
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt. Die 
solcherart erzeugten alphanumerischen Zeichen und Zeichenketten konnen jetzt fur 
verschiedene technische Zwecke (z.B. die Markierung und Identifizierung von Stoffen) 
eingesetzt werden und, evtl. nach zusatzlichen technischen Schritten, gemaB dem 

40 erfindungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden 
Polymeren (wie oben beschrieben) ausgeiesen werden. 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung 
eines Zufallszahlengenerators: 

Fur bestimmte Probleme der Informatik (z.B. Simulationen) und der Mathematik werden 
5 Zufallszahlen benotigt. Diese werden im allgemeinen rechnergestutzt durch Algorithmen 
erzeugt. Da diese Algorithmen jedoch deterministisch sind, handelt es sich bei den erzeugten 
Zufallszahlen nur um Pseudo-Zufallszahlen. Uberdies sind die erzeugten Zahlenreihen 
aufgrund der unterschiedlichen Gute der Algorithmen unterschiedlich gut randomisiert. 
Fur manche Anwendungen werden daher echte Zufallszahlen benotigt. 1st dies der Fall, muB 
10 ein physikalischer ProzeB in die Erzeugung von Zufallszahlen einbezogen werden. Ein solcher 
ProzeB ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechender 
Software verarbeitet wird. 

Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator 
implementiert werden, der Zufallszahlen sehr viel schneller erzeugt, als es mit herkommlichen 
1 5 Verfahren moglich ist. 

Der Zufallszahlengenerator wird mit folgender Grammatik implementiert (Grammatik fur 
binare Zufallszahlen beliebiger Lange): 
G = (Z, V, R, S) mit Z:= {0, 1 , s, e}, V:={S}, 

R:= 
20 { 

S:= sA 
A->0A 
A->1A 
A->e 

25 } 

wobei 

s:= Start 
e:= Ende 

Mit dieser Grammatik konnen Worter uber dem oben angegebenen Terminalalphabet 
30 S:= {0, 1 , s, e} 

gebildet werden. Alle Worter der Sprache L beginnen mit „s" und horen mit „e" auf, 
dazwischen befindet sich eine zufallige Anzahl (auch 0) zufalliger Bits („0" und „1"). 

Beispiel: Worter aus der Sprache L, die nach R gebildet werden: 
35 S->sA->se 

S->sA->s1A->ste 

S->sA->s0A->s00A->s001 A->s001 0A->s001 Oe 

S->sA->s1 A->s1 0A->s1 00A->s1 000A->s1 0000A->s1 00000A->s1 OOOOOe 
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Die als Wdrter der Spache L erzeugten Binarmuster konnen als Buchstaben, Zahlen, 
alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die 
Binardarstellung von Zahlen. so sind diese Binarmuster in Dezimaidarstellung: 
0 (leer) 
5 1 
2 

32 

und konnen als Zufallszahlen verwendet werden. Zur in vitro Implementierung eignen sich 
prinzipiell beliebige Sequenzen, solange sie eindeutig und zueinander maximal unahnlich sind. 
1 0 Z.B. konnen f oigende Algomere verwendet werden: 
sA: 

agctttatatctccatttgccctagtgaag 

aatatagaggtaaacgggatcacttcaacc 

A->0A: 

ttggcgagatatcaacgccaccccttgctt 

gctctatagttgcggtggggaacgaaaacc 

15 A->1A: 

ttggcgacccgggaaacaactattgctagt 

gctgggccctttgttgataacgatcaaacc 

A->e: 

ttggtgcgggagttggaagcaactacgatg 

acgccctcaaccttcgttgatgctacctag 

Die dazu benotigten Sequenzen sind handelsublich. Sie konnen z.B. bestellt werden als 
20 40nmol, PAGE gereinigt (ARK-Scientific, Darmstadt) und z.B. 100//M in Aqua dest. 
aufgenommen werden (empfohlene Lagerung bei -20°C). Aus den Sequenzen werden, wie 
im erfindungsgemaBen Schritt IV beschrieben, Algomere hergestellt. Diese Algomere werden, 
wie im erfindungsgemaRen Schritt V beschrieben, zu Logomeren polymerisiert und konnen 
gemaB dem erfindungsgemaRen Verfahren zum Auslesen von Information aus 
25 informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden. Derart 
erzeugte Zufallszahlen sind in Abbildung 6 zu sehen. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Verschliisselung 
30 von Logomeren: 

Die in Logomeren enthaltene Information kann verschlusselt werden. Dazu fungiert 
mindestens einer der fur die Auslese-PCR benotigten Primer als geheimer Schlussel (siehe 
Abbildung 11). Bevorzugt ist dies einer der in den Terminatoren primenden Primer. 1st die 
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Sequenz dieses Primers (Schlusselsequenz) und der Primer selbst nur autorisierten 
Zugreifern bekannt, so ist die in den derart verschlQsselten Logomeren enthaltene Information 
auch nur autorisierten Zugriffen zuganglich. 

Um ein Auslesen der in den Logomeren enthaltenen Information ohne diesen Schlussel zu 
5 verhindern, mussen weitere Vorkehrungen getroffen werden. Versuche, die Verschlusselung 
zu brechen, konnen darauf beruhen, uber die Vervielfaltigung nicht-geheimer Sequenzen auch 
die Logomere zu lesen. Sofern bakterielle Vektoren zur Klonierung von Logomeren verwendet 
werden, konnte ein potentieller Angreifer z.B. versuchen, die gesamte Klonierungssite mit 
PCR zu vervielfaltigen und dann mit Sequenzierung zu lesen Oder uber die zur Selektion 
10 benotigten Resistenzgene in die Klonierungssite "hineinzulesen". Auch konnten die 
Elongatoren selbst als Ansatzpunkte fur ein PCR-basiertes Lesen der geheimen Sequenz(en) 
dienen. 

j Solchen Angriffsversuchen ist gemein, daB sie uber nicht-geheime Sequenzen versuchen 
I konnten, die Schlusselsequenz zu entschlusseln und daruber die verschlusselte Sequenz zu 

15 lesen. Eine Abwehr derartiger Angriffsversuche kann dadurch erfolgen, daB zum 
Informationstransport uber Logomere immer nur vollstandig geheime Sequenzen verwendet 
werden. Jedoch ist dies evtl. zu aufwendig und kostentrachtig. Stattdessen Oder erganzend 
dazu konnen die informationstragenden Logomere mit Sequenzen (Scheinsequenzen) 
versetzt werden, die dieselben potentiellen Angriffspunkte (z.B. Bits, Resistenzgene) 

20 enthalten, jedoch jeweils andere Schlusselsequenzen. Durch diese Scheinsequenzen laufen 
potentielle Angiffsversuche ins Leere, weil fur den nicht-autorisierten Zugreifer alle 
Einzelsequenzen ununterscheidbar und dadurch die verschlQsselten Informationen verborgen 
sind. Mit je mehr Scheinsequenzen ein Logomer versetzt ist, um so schwieriger wird es, die 
Schlusselsequenz zu brechen. 

25 Das Verfahren entspricht einer molekularen Steganograf ie und wird exemplarisch anhand der 
Verschlusselung von Zeichen eines 1-Byte Atphabetes gezeigt: 

Es sei die verwendete Grammatik G = (E, V, R, S) mit Terminalalphabet Z:= {0, 1, Stoy, So, Si, 
s 2 , s M , s f , e}, wobei f e Z7V, f > 1. s key ist der geheime Schlussel. Fur eine Schlussellange 
von I ist dann die maximale theoretische Verschlusselung Keymax = a 1 , die maximal 

30 verwendbare Verschlusselung Key ef f = a M , wobei d die Anzahl der Basen angibt, ~m der sich 
ein Scheinschlussel von dem richtigen SchlOssel unterscheiden muB, damit in der Auslese- 
PCR kein Scheinschlussel die richtige Sequenz lesen und umgekehrt der richtige Schlussel 
kein Scheinlogomer (sondern nur das Ziellogomer) auslesen kann. Fur hochspezifische PCR 
Konditionen kann d > 1 werden. Weiterhin gibt Key imp = Anzahl Scheinschlussel + 1 die 

35 tatsachlich verwendete Verschlusselung und Key mln = 1 + x die minimale Verschlusselung an. 
Dabei ist x die zu einer minimalen Verschlusselung notige Anzahl von Scheiniogomeren. 
Diese kann im Falle der Verwendung von n Logomeren als Informationstrager groBer als n 
gewahlt werden. 

Fur Zeichenketten ergibt sich automatisch eine zusatzliche Verschlusselung, weil hier die fur 
40 einen potentiellen Angreifer unbekannte Reihenfolge der Zeichen zusatzlich verschlusselnd 
wirkt. 
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Beispiel: Fur eine Grammatik mit Zeichenketten von n 1-Byte Zeichen wird folgende 
Grammatik G verwendet: 

Es sei G = (Z, V, R, S) mit Terminalalphabet Z:= {0, 1 , s key0 , s keyU s key2 . .... s^,, s teym s 0 . s,, 
s 2 . s M , s f , e}, wobei n,f g W, n > 1. n gibt dabei die Anzahl der verwendeten echten 
5 Schlussel, f die Anzahl der verwendeten Scheinschiussel an; die verwendete Variablenmenge 
V und die verwendete Regeimenge R sind dabei wahlfrei und abhangig von der zu 
kodierenden Information. 

Grammatiken mit anderer Zeichenkodierung funktionieren analog. 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, 
10 wie in den erfindungsgemaBen Schritten II und 111 beschrieben, hergestellt. Algomere und 
Logomere werden, wie in den erfindungsgemaBen Schritten IV - V beschrieben, hergestellt, 
die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfaltigung 
von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt. Die 
solcherart erzeugten Logomere konnen, wie bereits als Auslese-PCR beschrieben, 
15 ausgelesen werden, wobei - wie beschrieben - einer der zum Auslesen benotigten Primer, 
bevorzugt einer der in den Terminatoren primenden Primer, als geheimer Schlussel fungiert. 
Mit der oben beschriebenen Grammatik werden zusatzlich zu den informationstragenden 
Logomeren „Scheinsequenzen" („Scheinlogomere a ) erzeugt, die einen nicht-autorisierten 
Auslese-Zugriff auf die in den Logomeren enthaltenen Informationen verhindern sollen. Das 
20 Verfahren kann fur alle Anwendungen von Logomeren benutzt werden und hat u.a. den 
Vorzug, durch die Spezifitat des als geheimer Schlussel benutzten Primers sehr effektiv zu 
sein. 

Basierend auf der beschriebenen Methode konnen symmetrische und asymmetrische 
25 Verschlusselungsverfahren implementiert werden. Fur ein symmetrisches 
Verschlusselungsverfahren reicht es, daB sich die Teilnehmer A und B einer Kommunikation 
auf eine geheimgehaltene Schlusselsequenz einigen. Teilnehmer B verschlusselt eine als 
Logomer gespeicherte Nachricht an A, indem B Logomere nur mit den geheimen 
Terminatoren herstellt und seine Nachricht mit zusatzlichen Logomeren versetzt, die andere 
30 Terminatoren tragen. Nur A ist es dann moglich, das zum Auslesen benotigte Primerpaar 
bereitzustellen, da nur A die benotigte Terminatorsequenz kennt. 

Ein asymmetrisches Verschlusselungsverfahren erfordert dagegen zusatzlichen Aufwand, z.B. 
den Einsatz von Molekulen mit irregularen Formen (siehe z.B. Abbildung 12 und Abbildung 

35 13): Will ein Kommunikationsteilnehmer B eine verschlusselte Nachricht an A schicken, so 
bekommt er von A einen offentlichen Schlussel, den er zur Verschlusselung der als Logomer 
reprasentierten Nachricht verwenden kann. Der offentliche Schlussel von A besteht aus einem 
Paar von Terminatoren und einem Pool zusatzlicher Scheintermtnatoren mit ahnBchen 
Eigenschaften, jedoch abweichenden Sequenzen und anderen S'-Uberhangsequenzen. Von 

40 den echten Terminatoren ist lediglich die 3' Uberhangsequenz bekannt, mit der sie an die - 
offentlich bekannten - Elongatoren verknupft werden kann. Zur Verschlusselung einer 
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Nachricht erzeugt B Logomere, wobei er in der Symbolpolymerisationsreaktion den von A 
offentlich bereitgestellten Schlussel (enthaltend Terminatoren und Scheinterminatoren) 
verwendet. Die Art und Weise der Terminatoren gewahrleistet nun, daB lediglich A in der Lage 
ist, die solcherart verschlusselte Nachricht wieder zu lesen: Da nur A die tatsachliche Sequenz 
5 der echten Terminatoren kennt, ist nur A in der Lage, die ais Logomere verschlusselte 
Nachricht uber Auslese-PCR wieder zu lesen. 

Weil der offentliche Schlussel potentiell uber die bekannte Uberhangsequenz zu den 
Elongatoren angreifbar ist (weil die Scheinterminatoren diese Uberhangsequenz nicht 
besitzen durfen, kann ein poientieller Angreifer eine beliebige Sequenz an die echten 

10 Terminatoren knupfen, wodurch die Sequenz der Terminatoren identifiziert werden kann), 
werden als Terminatoren Molekule auf der Basis irregularer Formen, z. B. auf der Basis der in 
Abbildung 12 gezeigten Y-formigen Molekule verwendet. Die gezeigten Y-formigen Molekule 
lassen sich zu weiter verzweigten baumartigen Molekulen zusammensetzen. Die Wurzel eines 
solchen als Baum realisierten Terminatormolekuls enthalt dann die zu den Elongatoren 

15 kompatible Uberhangsequenz, wahrend nur eine der Aste des Baumes die echte 
Terminatorsequenz enthalt. Da die verschlusselte Nachricht wie oben beschrieben zusatzlich 
mit Scheinlogomeren versetzt ist, kann dann nur A, der die echte Terminatorsequenz kennt, 
aus der Menge der Molekule die richtige Nachricht durch Verknupfen mit dem kompatiblen 
Vektor herausfiltern, wohingegen ein potentieller Angreifer ohne Kenntnis der echten 

20 Terminatorsequenz dies nicht kann. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die VerschlQsselung 
mit Echtzeit-ldentiftzierung: 

25 

Ohne das Auslesen der in verschlusselten Logomeren enthaltenen Informationen kann das 
Vorhandensein der Schlusselsequenz selbst Auskunft daruber geben, ob ein 
gekennzeichnetes Produkt echt ist, oder nicht. Die Information uber die Authentizitat des 
gekennzeichneten Produktes kann dabei uber einen ProzeB, bei dem der Schlusseiprimer als 
30 Hybridisierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder fatsifiziert 
werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
35 informationstragenden Polymere, zur VerschlQsselung von Information. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise einen Test der 
Qualitat von Oligonukleotiden: 

40 
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Ein typisches Problem bei der Herstellung von Oligonukleotiden. z.B. fur molekularbiologische 
Zwecke, ist die Qualitatskontrolle derselben, die aufgrund des Herstellungsprozesses und der 
schwankenden Qualitat der verwendeten Chemikalien problematisch ist. 
Das in den erfindungsgemaBen Schritten I - V beschriebene Verfahren kann benutzt werden, 
5 die Qualitat von Oligonukleotiden zu testen. Dazu wird eine binare Grammatik wie die fur den 
Zufallszahlengenerator (s.o.) Oder eine unare Grammatik wie die zur Herstellung von 
Molekulargewichtsstandards (s.u.) zur Erzeugung beliebig langer Logomere verwendet. Bei 
ansonsten identischen Bedingungen ist dann die Lange der aus einer Symbolpolymerisation 
(Schritt V des erfindungsgemaBen Venahrens) erhaltenen Logomere direkt proportional zur 

10 Qualitat der verwendeten Oligonukleotide: Je langer die elektrophoretisch sichtbar gemachten 
Logomere sind, desto besser ist die Qualitat der verwendeten Oligonukleotide. Ein Beispiel fur 
die aus einer Symbolpolymerisation erhaltene Leiter unterschiedlich langer Logomere findet 
sich unter Abbildung 3. I 1 
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 

15 informationstragender Polymere. insbesondere der erfindungsgemaB erh§ltlichen 
informationstragenden Polymere, zur Qualitatskontrolle synthetisch hergestellter 
Oligonukleotide. 



20 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von 
Logomeren als Marker und Signaturen 

Aufgrund der Fahigkeit, prinzipiell beliebige Informationen darzustellen, lassen sich die hier 
beschriebenen Logomere als Marker verwenden, urn Erzeugnisse, Produkte, Stoffe und 
25 Gerate zu kennzeichnen. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, als Marker oder Signaturen. 

Die Logomere konnen als "binares EtiketT verwendet werden, das einem Erzeugnis 
30 hinzugefugt wird und Informationen uber das derart gekennzeichnete Erzeugnis enthalt. Die 
Logomere konnen dabei z.B. Informationen uber 

a) Hersteiler 

b) Produkt (z.B. Seriennummer) 

c) Verwendungszweck 
35 d) Stoffklasse 

e) Gefahrenklasse 

f) Qualitat 

g) Reinheit 

h) Produktions- und Verfallsdatum 

40 enthalten. Es lassen sich damit nahezu beliebige Produkte und Erzeugnisse mit nahezu 
beiiebigen Informationen versehen. Da die Logomere ungiftig und biologisch abbaubar sind, 
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konnen sie auch fur hochsensible Produkte wie Nahrungsmittel, Medikamente und 
pharmazeutische Erzeugnisse eingesetzt werden. 
Gekennzeichnete Erzeugnisse konnen z.B. sein: 

a) chemische Erzeugnisse, z.B. Lacke, Farben, Ole, Schmier- und Treibstoffe, 
5 Losungsmittel, Tinte usw. 

b) flussige Materialien: Losungen, Suspensionen, Emulsionen 

c) gentechnische Erzeugnisse 

d) Nahrungsmittel, z.B. zur Kennzeichnung gentechnisch veranderter Bestandteile Oder dem 
Monitoring von Nahrungsmitteln wahrend des Produktionsprozesses 

1 0 e) Medikamente und pharmazeutische Erzeugnisse 

f) Papiererzeugnisse, Dokumente, Geld 

g) Gerate 

Der Bedarf zur Kennzeichnung von Produkten besteht in den unterschiediichsten Bereichen 

15 und aufgrund unterschiedlicher Anforderungen. Grunde fur eine Kennzeichnung konnen z.B. 
sein: Qualitatssicherung beim ProduktionsprozeB, Uberwachung der Produktreinheit und 
Vermeidung von Kontaminationen, Schutz vor Falschung und Produktpiraterie, Nachweis 
bestimmter Produktbestandteile, Produktkennzeichnung mit beiiebigen Produktinformationen. 
Dieser Bedarf stellt sich auch in besonders sensiblen Bereichen, etwa bei der Kennzeichnung 

20 von Nahrungsmitteln, medizinischen und pharmazeutischen Erzeugnissen und gentechnisch 
hergestellten Oder veranderten Erzeugnissen. Hier ist es wunschenswert, daB Informationen 
uber das jeweilige Produkt direkt am Produkt verfugbar sind, insbesondere wenn 
Verwechselungen oder Falschungen vermieden werden sollen und auch die Identifikation 
unterschiedlicher Bestandteile eines Erzeugnisses gewunscht ist. 

25 Es gibt zahlreiche Beispiele fur den Bedarf von Produktkennzeichnungen. Z.B. konnen 
Logomere als Seriennummern eingesetzt werden, die in Autoiacke gemischt werden, wodurch 
der Fahrzeughalter im Versicherungsfall (z.B. Unfall Oder Diebstahl) identifiziert werden kann. 
Durch Produktkennzeichnungen konnte die Qualitat und Reinheit chemischer Erzeugnisse 
uberwacht und Kontaminationen vermieden werden. Ein permanentes Problem ist die 

30 Falschung von Dokumenten, Unterschriften und Geld, die hochentwickelte 
Kennzeichnungsverfahren notig macht. 

Vor allem vor dem Hintergrund von Tierkrankheiten und -seuchen (BSE, Schweinepest, 
Salmonellenvergiftungen usw.) stellt sich das Problem der Qualitatssicherung von 
Nahrungsmitteln und der Kennzeichnung von Endprodukten, urn kontaminierte Produkte vom 

35 Verbrauch fernzuhalten. Ein weiteres Problem sind Nahrungsmittel, die gentechnisch 
hergestellte Bestandteile enthalten. Diese Bestandteile konnen ohne ein 
Kennzeichnungsverfahren im Endprodukt uberhaupt nicht oder nur sehr schwer 
nachgewiesen werden. Das Problem stellt sich insbesondere dadurch, daB vieie 
Nahrungsmittel Bestandteile unterschiedlicher Herkunft enthalten und die Produktionswege 

40 teiiweise undurchschaubar sind. 
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Das Problem der Kennzeichnung stellt sich z.B. auch im Bereich von Blutprodukten, wo z.B. 
durch Pooling Kontaminationen auftreten konnen. Auch ware es hier z.T. wunschenswert, 
Informationen uber Identitat, Herkunft, Produktions- und Verfallsdatum direkt mit dem Produkt 
verfugbar zu haben. Ahnliches gilt auch fur Medikamente und pharmazeutische Produkte. 

5 

Bisher verwendet man zur Kennzeichnung und Markierung von Farben, Lacken, Treibstoffen, 
usw. verschiedene Kohlenstoffverbindungen, Polyaniline, Flussigkristalie oder andere 
chemische Verbindungen. Diese Stofte und Verbindungen haben unterschiedliche 
Schwachen: sie sind z.T. toxisch, nur schwer bioiogisch abbaubar, die verfugbare 
10 Informationskapazitat ist stark eingeschrankt, sie wechselwirken chemisch mit bestimmten 
Stoffen oder sind nur teuer und aufwendig herzustellen. 

Fur den Einsatz zur Kennzeichnung von sensiblen und hochsensiblen Erzeugnissen wie 
Nahrungsmitteln oder Medikamenten sind die genannten Stoffe und Verbindungen aufgrund 
der genannten Nachteile uberhaupt nicht geeignet. 
15 Die Anforderungen, die sich fur ein Kennzeichnungsverfahren von beliebigen Erzeugnissen 
stellen umfassen zumindest: 

Die Kennzeichnung sollte direkt im oder am Erzeugnis verfugbar sein; 

die Kennzeichnung sollte gut nachweisbar sein; 

die Kennzeichnung muB gesundheitlich unbedenklich sein. 
20 Gegenuber den bisher verwendeten Verbindungen haben die hier beschriebenen Logomere 
folgende Vorzuge: 

Kodierung beiiebiger Informationen, 

hohe Speicherkapazitat, 

gesundheitlich unbedenklich, 
25 - chemisch, bioiogisch, pharmakologisch und genetisch neutral, 

leicht bioiogisch abbaubar (Biomolekule), 

keine Umweltbelastung, 

sehr gute Nachweisbarkeit, 

hohe Kompatibilitat zu bestehenden Techniken der Informatik und Molekularbioiogie 
30 (PCR), 

Informationen konnen verschlusselt werden und eignen sich auch zu Authentifizierung 
und Verschlusselung, 

Identifikation einzelner Bestandteile in Produktmischungen, 

billig in groBen Mengen herzustellen (Klonierung, Vervielfaltigung mit Bakterien in 
35 Fermentern). 

Diese Eigenschaften machen Logomere fur die genannten Aufgaben sehr viel besser 
geeignet als die bestehenden Techniken. Oberdies erschlieBen sich Einsatzbereiche, die mit 
den bisherigen Techniken nicht moglich waren. 
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Aufgrund der Eigenschaften nukleinsaurebasierter Logomere konnen diese auch zur 
Kennzeichnung von besonders sensiblen Produkten wie Nahrungsmitteln und 
pharmazeutischen Erzeugnissen verwendet werden. 

Die Grunde dafur liegen zum einen in der chemischen Beschaffenheit nukleinsaurebasierter 
5 Logomere und zum anderen in der Kodierung von infonmationen in Logomeren: 

1) Als "Grundbausteine des Lebens" sind Nukleinsauren Elementarbausteine aller bisher 
bekannten biologischen Lebensformen. Daher konnen sie aufgrund ihrer chemischen 
Beschaffenheit fur keinen bekannten biologischen Organismus schadlich sein 
("biochemische Kompatibilitaf)- Aufgrund der enthaltenen genetischen ft iformationen (des 

10 enthaltenen Programmes) konnen Nukleinsauren jedoch sehr wohl potentiell schadlich 

sein, wenn sie in einem Organismus abgelesen werden: Falls sie etwa fur giftige Proteine 
kodieren Oder (wie im Falle viralen Erbgutes) einen jeweiligen Zielorganismus 
"umprogrammieren" konnen. Die hier verwendeten Logomere konnen jedoch aus den im 
Folgenden genannten Grunden keine fur einen Organismus schadlichen Informationen 

15 enthatten. 

2) Logomere enthalten keine genetischen, d.h. biologisch relevanten Informationen 
("semantische Inkompatibilitaf): Bezuglich der enthaltenen Informationen entsprechen 
Logomere Buchstaben, Zahlen Oder Folgen von Buchstaben und Zahlen in 
Binarkodierung, die fur uns Oder einen Computer, jedoch nicht fur den genetischen 

20 Apparat eines Organismus iesbar sind. Fur einen biologischen Organismus sind sie 

schlicht "Unsinnscode". 

3) Logomere, insbesondere die Algomere, aus denen sie aufgebaut sind, sind zu kurz um 
auch nur zufallig biologisch relevante Informationen zu enthalten. 

4) Um jede Eventualitat (der unwahrscheinliche Fall, daB die Binarinformationen der 
25 Logomere auf irgendeine Weise von irgendeinem Organismus als genetisch relevante 

Information interpretiert wird) auszuschlieBen, werden die zur Kodierung von Symbolen 
verwendeten Sequenzen im Falle sensibler Anwendungsbereiche mit Stopcodons 
versehen, so daB sie niemals von einem biologischen Organismus abgelesen werden 
konnen. 

30 5) Als elementare Bestandteile aller biologischen Organismen sind Nukleinsauren in unserer 
Umwelt allgegenwartig. Sie werden in kurzester Zeit abgebaut. 



Um als Marker eingesetzt zu werden, konnen Logomere nach den in den erfindungsgemaBen 
Schritten I - V beschriebenen Verfahren erzeugt und nach den erfindungsgemaBen oben 

35 beschriebenen Verfahren vervielfaltigt werden. Je nach Einsatzbereich konnen zur 
Vervielfaltigung der Logomere verschiedene Verfahren und verschiedene 
Aufarbeitungsprozesse vorgenommen werden. Zur Kennzeichnung petrochemischer 
Erzeugnisse z.B. konnen Logomere durch Klonierung in Bakterien vervielfaltigt werden. Um 
unnotige Kontaminationen zu vermeiden, konnen die erhaltenen Bakterien lysiert werden. 

40 Eine spezielle Aufreinigung der Logomer-DNA ist im Allgemeinen nicht notig. 
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Zur Herstellung von Logomeren fur sensible und hochsensibie Produkte ist dagegen ein 
aufwendigeres Vervielfaltigungs- und Aufreinigungsverfahren notig. Ziel ist dabei der Erhalt 
moglichst reiner Logomere. Um biologische Zwischenschritte zu vermeiden, kann die 
Vervielfaltigung - wie erfindungsgemaB beschrieben - mit PCR vorgenommen werden. Sollte 
5 eine Vervielfaltigung durch Klonierung vorgenommen werden, so ist die Aufreinigung der 
erhaltenen DNA aus Bakterien notig. Sind die Logomere in bakteriellen Vektoren kloniert, so 
ist ein gezielter Abbau dieser Resistenzgene (z. B. durch Restriktionsenzyme) Bestandteil 
einer weiteren Aufarbeitung. 

10 Logomere konnen zur Kennzeichnung eines Produktes unmittelbar mit diesem verbunden 
werden. Sie konnen z.B. in flussige Stoffe gemischt werden oder auf feste Stoffe aufgebracht 
werden. Im Falle gentechnischer Erzeugnisse konnen die Logomere mithilfe von 
Rekombinations- und Klonierungstechniken kovaient mit dem zu kennzeichnenden Produkt 
verbunden werden. 

15 Die Kennzeichnung von Stoffen und Produkten durch Logomere ermdglichen u.a. das 
Monitoring von Produktionsprozessen, die Qualitatskontrolle, die Identifikation einzelner 
Bestandteile und den quantitativen und qualitativen Nachweis von Kontaminationen. 



Ein Aspekt der vorliegenden Erfindung wird im folgenden am Beisptel der Herstellung 
20 Computer-kompatibler Daten (Bytes/Multibytes) aus Nukleinsauren und ihrer Verwendung zur 
Markierung unterschiedlicher Materialien erlautert, schrankt die Erfindung jedoch nicht auf 
dieses Beispiel ein: 



1. Es wird eine Kodierung von Bytes und Multibytes in Form von Nukleinsauren definiert. 
25 2. Geeignete Sequenzen zur Representation von Bytes und Multibytes werden konstruiert. 

3. Eine Bibliothek (Library) von Byte-reprasentierenden Nukleinsauren wird in vitro 
hergestellt. 

4. Bytes werden zu Multibytes verknupft. 

5. Biochips werden zur Identifikation von Bytes und Multibytes hergestellt. 

30 6. Unterschiedliche (organische und anorganische) Materialien und Gegenstande sowie 
einzelne Gene werden mit Bytes oder Multibytes gekennzeichnet (und ggfs. verschlusselt). 
7. Die Information gekennzeichneter Materialien, Gegenstande oder einzelner Gene wird 
ausgelesen (und ggfs. zu entschlusselt). 

35 Erlauterung zu 1 : 

Die Representation von Daten mit Nukleinsauren soil gewahrleisten, daB die Daten Computer- 
kompatibel sind. Zu diesem Zweck wird als universellste Darsteltung von Computerdaten die 
Representation von Bytes und Multibytes gewahlt. 
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Dazu wird eine Grammatik G C32 definiert, G C3 2 = (Z, V, R, S) mit Terminalalphabet 2:= {x n , o m> 
s m , e m } f Variablenalphabet V:= {A, B, C}, Startsymbol S und Regelmenge R:={S:=oA, A->s m B, 
B->Ce m> C->x n }, wobei n, m e IN, n = {0, 1, 255 } und m > 0. Die Grammatik beschreibt die 
Konstruktion von Molekulen der Form osxe, wobei x alle Bytewert zwischen 0 und 255 
5 annehmen kann, s Bytepositionen beschreibt und o und e fur das Verketten von Einzelbytes 
zu Multibytes vorgesehen ist (siehe Abbildung 29 und Abbildung 30). Zur Vereinfachung des 
Herstellungsprozesses werden Restriktionssites als Variablen verwendet. 
AuBerdem mussen die verwendeten Nukleinsauren logische, physikalische, chemische und 
biologische Eigenschaften haben. Insbesondere mussen/sollen sie einfach zu vervielfaltigen, 
10 einfach zu lesen sein und auf definierte Weise mit biologischen Sequenzen interagieren. 
Zu diesem Zweck werden datenreprasentierende Nukleinsauren so definiert, daB 

a) sie Bytes darstellen 

b) auch komplexere Datenstrukturen (Multibytes) darstellen konnen 

c) einzelne Bytes zu Multibytes verknupft werden konnen 
15 d) sie mit einem Biochip gelesen werden konnen 

e) sie selbst zur Herstellung von 1-Byte und Multibyte Biochips dienen konnen 

f) einzelne Bytes und Multibytes mit PCR vervielfaltigt werden konnen 

g) klonierbar sind 

h) mit anderen Nukleinsauren so verknupft werden konnen, daB sie diese markieren 
20 t) moglichst wenige Restriktionssites tragen 



a) Damit die datenreprasentierenden Nukleinsauren Bytes darstellen konnen, mussen genau 
256 eindeutige Sequenzen alle Werte eines Bytes reprasentieren. Dazu enthalten die 
molekularen Bytes eine eindeutige Sequenz x, von der es 256 verschiedene Allele gibt. 
Diese Allele werden als Xq bis x 2S s bezeichnet und enumerieren genau alle Bytewerte (x 0 = 

0, x, = 1 X255 = 255) (siehe Abbildung 25, Abbildung 26, Abbildung 27, Abbildung 28 

und Sequenzprotokoll). 

b) Urn komplexere Datenstrukturen (Multibytes) wie z.B. 32-Bit Zahlen und Strings darstellen 
zu konnen, werden die Bytemolekule so konstruiert, daB sie mit einer Positionsinformation 
versehen werde. Diese ist in Form der Sequenz s enthalten (siehe Abbildung 25, 
Abbildung 26, Abbildung 27, Abbildung 28 und Sequenzprotokoll). Jede Position ist durch 
eine eindeutige Sequenz s s dargestellt. Mit den verschiedenen Allelen von s werden dann 
alle Bytepositionen enumeriert (s 0 = Position 0, St = Position 1 , ... usw.). 

c) Obwohl es im Prinzip zur Darstellung von Multibytes ausreicht, die darzustellenden Daten 
auf unabhangige Bytes mit den entsprechenden Positionsinformationen zu verteilen (als 
mehrstrangige Multibytes: z.B. konnen, urn einen Lack mit einer 4 Byte langen 
Seriennummer zu versehen, 4 einzelne Bytes die jeweils genau eine Positionsinformation 
von s 0 bis s 3 besitzen unabhangig voneinander in den Lack gemischt werden), ist es 
manchmal zweckmaBig, Bytes direkt zu einstrangigen Multibytes zu verknupfen. Dazu 
tragen die Bytes die Sequenzen o und e (siehe Abbildung 25 bis Abbildung 28 und 
Sequenzprotokoll), mit denen sie sich durch Ligation oder overlap assembly und PCR zu 
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einstrangigen Multibytes verknupfen lassen (siehe Abbildung 29 und Abbildung 30). Diese 
einstangigen Multibytes konnen dann ihrerseits als Marker verwendet werden. Im Falle 
des parallel overlap assembly werden die einzelnen Bytes mit einem geeigneten 
Restriktionsenzym (hier: EcoRV siehe Abbildung 28) ausgeschnitten. 
5 d) Datenreprasentierende Nukleinsauren konnen z.B. mithilfe von Sequenzierem gelesen 
werden. Damit sie jedoch moglichst einfach und schnell gelesen werden konnen, ist 
insbesondere vorgesehen, sie mithilfe von Biochips zu lesen. Dazu werden Biochips 
hergestellt, die alle 256 verschiedenen x-Sequenzen einzelstrangig (und damit alle 
Bytewerte) aufsteigend geordnet enthalten (siehe Abbildung 32 und Abbildung 33). 

10 SolchermaBen hergestellte Biochips sind ebenfalls Gegenstand der vorliegenden 

Erfindung. Das Ausiesen eines bestimmten Bytewertes Xj erfolgt dann durch Denaturieren 
des entsprechenden Datenmolekuls zu Einzelstrangen und Hybridisieren mit dem Chip. 
Dabei werden die hybridisierten Sequenzen analog der typischen Funktionsweise von 
Biochips markiert, z.B. durch Fluoreszenzmarkierung. Nach dem Hybridisieren von 

15 Datenmoiekul mit einem 1-Byte Chip enthalt man dadurch genau eine markierte Position 

auf dem Biochip, die damit genau den Bytewert bezeichnet (siehe Abbildung 36). Z.B. 
hybridisiert das Datenmoiekul, das die Sequenz x 192 tragt, genau an der Position 192 im 
Chip, und kann anhand der Position innerhalb des Chips identifiziert werden. 

e) Da das Prinzip des Ausiesens von Datenmolekulen mithilfe des Biochips auf der 
20 Hybridisierung komplementarer Sequenzen beruht, werden die Bytes so konstruiert, daB 

sie gleichzeitig zur Herstellung der entsprechenden Biochips dienen konnen. Dazu tragen 
die Bytemolekule enzymatische Restriktionssites, so daB aus einem vollstandigen 
Bytemoiekul entweder die x enthaltende Subsequenz oder die s und x enthaltende 
Subsequenz ausgeschnitten werden konnen. Diese Subsequenzen werden dann 

25 denaturiert und auf einen Chiptrager gespottet. Urn einen 1-Byte Chip herzustellen werden 

alle 256 x-Sequenzen aufsteigend geordnet auf den Chip aufgetragen. Dadurch ist es 
moglich, eine Sequenz mit vorher unbekanntem x anhand iherer Hybridisierungsposition 
zu identifizieren. Verwendet man nur die x Subsequenz fur die Herstellung des 1-Byte 
Chips, so enthalt man als X-Chips bezeichnete Chips (siehe Abbildung 32), verwendet 

30 man die s und x enthaltende Subsequenz, so erhalt man die als SX-Chips bezeichnete 

Chips (siehe Abbildung 33). Sowohl X- als auch SX-Chips konnen auch zu Multibyte 
Chips kombiniert werden. Eine weitere Voraussetzung fur das Herstellen von Biochips ist 
die Verfugbarkeit ausreichender Mengen von Sequenzen. Dazu kann man die 
Bytemolekule entweder direkt mit Oligosynthesizern herstellen, sie klonieren oder aus 

35 wenigen Template-Molekulen mit PCR vervielfaltigen. 

f) Urn gezieit einzelne Bytes (z.B. aus einstrangigen Multibytes) zu vervielfaltigen, konnen 
die als o, s, und e bezeichneten Subsequenzen als priming sites dienen (siehe Abbildung 
25, Abbildung 26, Abbildung 27, Abbildung 28). 

g) Urn klonierbar zu sein tragen die Bytemolekule sticky ends die zu Restriktionssites 
40 kompatibel sind (z.B. Xhol und Xbal, siehe Abbildung 28). 
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h) Damit Bytes und Multibytes leichter mit beliebigen Nukleinsauren verknupft werden 
konnen, konnen entweder durch Ligation Oder durch overlap assembly und PCR weitere 
Terminatoren (Adaptoren) an Bytes und Multibytes angehangt werden (siehe Abbildung 
29 und Abbildung 30). Diese Adaptoren tragen dazu Restriktionssites Oder 

5 Rekombinationssites, so daG sie entweder durch Restriktion und Ligation Oder durch 

Rekornbination mit anderen Nukleinsauren verknupft werden konnen. Dies ist 
insbesondere zur Kennzeichnung von Nukleinsauren, insbesondere Genen vorteilhaft. 

i) Im Zusammenhang mit der Verknupfung von Bytes und Multibytes mit anderen 
Nukleinsauren ist es vorteilhaft, daB insbesondere Multibytes nur wenige Restriktionssites 

10 tragen, damit der Verwender von Nukleinsauren die mit Bytes und Multibytes versehen 

sind, moglichst wie gewohnt damit arbeiten kann und moglichst auf keine Restriktionssites 
verzichten muB, die ansonsten die Bytes zerstoren. Daher sind die Bytes so konstruiert, 
| daB nach der Herstellung von einstrangigen Multibytes von alien Restriktionssites, die auf 
Sequenzpalindromen der Lange 6 beruhen nur noch die Restriktionssites Af III, Nhel und 

15 Ncol in den Multibytes enthalten sind und daher nicht ohne weiteres z.B. fur mit Multibytes 

markierte Nukleinsauren verwendet werden konnen. Ggfs. lassen sich sogar die noch 
verbleibenden Restriktionssites aus den Bytes und Multibytes entfernen ohne die Byte und 
Positionsinformationen zu verlieren, indem man Multibytes mit PCR und mutierten 
Primern so vervielfaltigt, daB die Restriktionssites blockiert werden. 

20 

Erlauterung zu 2: 

Die zur Implementierung benotigten Sequenzen werden mithilfe des bereits 
beschriebenen NFR-Verfahrens synthetisiert. Die Sequenzen sind so konstruiert, 
daB alle Sequenzen untereinander moglichst unahnlich sind. Die x-Subsequenzen 
25 haben einen GC-Anteil von 50%, die o- f s- und e-Sequenzen haben einen GC-Anteil 
von 66%, Multibytes enthalten 3 Sequenzpalindrome der Lange 6, die jeweils einmal 
von Aflll, Nhel und Ncol erkannt werden. 

Erlauterung zu 3: Die Bytemolekule konnen direkt mit Hilfe eines Oligosynthesizers 
30 hergestelit werden. Um groBere Mengen von Bytemolekulen herzustellen ist es 
jedoch oft zweckmaBig, eine Klonbibliothek anzulegen, die alle Bytemolekule enthalt. 
Erlauterung zu 4: Bytes konnen aufgrund der enthaltenen Bytepositionsinformation 
auch ohne direkt miteinander verknupft zu werden Multibytes darstellen (logische 
Verknupfung zu mehrstrangigen Multibytes). Es ist jedoch fur einige Anwendungen, 
35 z.B. die Kennzeichnung von Nukleinsaurestrangen zweckmaBig, die einzelnen Bytes 
auch physikalisch zu einem Multibyte zu verknupfen (einstrangiges Multibyte, siehe 
Abbildung 30 und Abbildung 31). Dazu werden die einzelnen Bytes entweder durch 
Ligation oder durch overlap assembly und PCR miteinander verknupft. 
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Erlauterung zu 5: Biochips zum Lesen von Bytes und Multibytes werden mit 
Untereinheiten der Molekule hergestellt, die als Bytes fungieren. Grundsatzlich gibt 
es zumindest 2 Architekturen: den X-Chip (siehe Abbiidung 32), der mit x- 
Subsequenzen (siehe Abbiidung 25 bis Abbiidung 28) und den SX-Chip (siehe Abbiidung 
5 33), der mit sx-Subsequenzen (siehe Abbiidung 25 bis Abbiidung 28) hergestellt wird. 
Beide Chips sind 1-Byte Chips und konnen zu Multibyte Chips kombiniert werden. 
Die prinzipielle Funktionsweise ist ahnlich: Das Auslesen der Information von 
Datenmolekulen erfolgt durch Hybridisieren mit dem Chip. Anhar.c! der 
Hybridisierungsposition des Datenmolekuls laGt sich sein Bytewert ablesen. 

10 Dadurch wird es auch moglich, Multibyte Chips als Datenspeicher (ROM und RAM) 
zu verwenden: Das Hybridisieren des Chips mit einem spezifischen Datenmolekul 
entspricht dem Zuweisen eines Wertes an eine Speicherzelle. Durch Denaturieren 
(z.B. uber Temperaturerhohung Oder pH-Wert Anderung) wird die Speicherzelle 
wieder geloscht. Daruber hinaus konnen spezifische Sequenzen die mit dem Chip 

15 hybridisiert werden auch mit optisch aktiven Molekulen unterschiedlicher Farbe 
versehen werden, so daB sich auch gezielt Farbmuster erzeugen lassen, so daB sich 
Multibyte Chips auch als Display verwenden lassen. Kombiniert man Sequenzen 
unterschiedlicher Schmelztemperatur mit optisch aktiven Molekulen verschiedener 
Farbe, so kann auch eine Farbanzeige im Sinne eines Thermometers erfolgen. 

20 Der Unterschied zwischen X-Chip und SX-Chip besteht darin, daB der SX-Chip 
zusatzlich zum Bytewert auch die Byteposition lesen (und speichern) kann. Vorteil 
des X-Chip ist, daB man sehr groBe Multibyte-Arrays aus identischen X-Chips 
herstelien kann. Vorteil des SX-Chips ist, daB sich damit einstrangige Multibyte- 
Molekule lesen lassen, ohne daB man die einzelnen Bytes getrennt voneinander 

25 hybridisieren muBte. 

Erlauterung zu 6: Uber die Adaptoren L und R (siehe Abbiidung 29 und Abbiidung 30) 
lassen sich Sequenzen mit Bytes und Multibytes verbinden, die dazu dienen, diese 

30 mit Nukleinsauren zu verbinden. Dazu enthalten die Adaptoren z.B. geeignete 
Restriktionssites oder Rekombinationssites. Z.B. laBt sich das ein Multibyte mithilfe 
von geeigneten Restriktionssites in einem Plasmid klonieren, wodurch dieses 
Plasmid eine Kennzeichnung erhalt. Diese kann z.B. in einer 32-Bit Seriennummer 
bestehen (siehe Abbiidung 31 ). Ein anderes Anwendungsbeispiel ist das Anbringen 

35 von Rekombinstionssites an ein Datenmolekul, wodurch dieses z.B. in nicht- 
kodierende Regionen (z.B. Introns) von Genen eingebracht werden kann, wodurch 
diese gekennzeichnet werden. 
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Erlauterung zu 7: Die Information von Materialien, Gegenstanden und Molekulen, die 
mit Datenmolekulen gekennzeichnet wurden lassen sich dadurch auslesen, daB man 
sie aus dem gekennzeichneten Material extrahiert, ggfs. aufreinigt, ggfs. mit PCR 
5 amplifiziert und dann entweder sequenziert Oder durch Hybridisieren mit einem Byte- 
oder Multibyte-Chip wie oben identifiziert. 

Die oben beschriebenen Verfahren ermogiichen somit die eindeutige Kennzeichnung 
von organischen und anorganischen Materialien und Gegenstanden sowie von 
10 Nukleinsaure-Konstrukten und Genen. 

Die oben beschriebenen Verfahren ermogiichen auBerdem die Herstellung von 
Datenspeichern und optischen ( Displays: Zum Zwecke der Speicherung von 
Computerdaten werden Multibyte-Arrays verwendet. Das Schreiben eines einzelnen 
15 Byte erfolgt durch das Hybridisieren eines 1-Byte Chips mit einer (ggfs. optisch 
markierten) Nukleinsaure, die genau einmal eine definierte x-Sequenz enthalt, die 
dem zu schreibenden Wert entspricht (z.B. x 192 ). Das Auslesen der Daten erfolgt 
analog dem Auslesen biologischer DNA-Arrays, z.B. durch Scannen. Das Loschen 
von Daten erfolgt durch Denaturieren und ggfs. nachtragliches Waschen. 

20 

Die oben beschriebenen Verfahren ermogiichen beispielsweise die Kennzeichnung 
einzelner Molekule, Nukleinsauren und gentechnisch hergestellter oder veranderter 
Erzeugnisse: 

25 

Die hier beschriebenen Logomere konnen zur Kennzeichnung gentechnisch hergestellter oder 
veranderter Erzeugnisse verwendet werden. 

Bisher werden insbesondere zur Identifikation gentechnisch hergestellter oder veranderter 
Erzeugnisse in Nahrungsmitteln "klassische" molekularbiologische Methoden wie PCR, 
30 Restriktionsverdau, Southernblot-Hybridisierung und Sequenzierung verwendet. Mit diesen 
Methoden ist jedoch eine Charakterisierung gentechnischer Erzeugnisse und Bestandtetle 
noch sehr aufwendig und erfordert fur jedes zu charakterisierende Erzeugnis eigene 
Methoden und Verfahren. 

Insgesamt gibt es bisher kein universelles Kennzeichnungsverfahren fur gentechnisch 
35 hergestellte Erzeugnisse. Ein solches Kennzeichnungsverfahren muB mehrere Kriterien 
erfCillen: 

die Kennzeichnung mufB gesundheitlich absolut unbedenklich sein, 

die Kennzeichnung sollte untrennbar mit dem gekennzeichneten Produkt verbunden sein, 

die Kennzeichnung sollte falschungssicher sein, 
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die Kennzeichnung sollte genugend Informationen speichern konnen, 

die Kennzeichnung sollte in geringen Mengen nachweisbar und lesbar sein. 
Der Einsatz nukleinsaurebasierter Logomere zur Kennzeichnung gentechnischer Erzeugnisse 
erfullt diese Kriterien und hat daruber hinaus folgende Vorzuge: 
5 - Logomere konnen nahezu beliebige Informationen speichern; 

einzelne Bestandteile konnen schnell und hochempfindlich nachgewiesen werden; 

zum Auslesen der Informationen kann eine bis ins Detail standardisierte Methode 

eingesetzt werden (Ausleseverfahren nach dem erfindungsgemaBen Verfahrens, dabei 

konnen standardisierte Primer verwendet werden); 
10 - die Sequenz der gesuchten Gene kann vollkommen unbekannt sein; 

die Sequenz der nachgewiesenen Gene kann geheim sein, ohne daf3 die Identifizierung 

Oder Authentifizierung eingeschrankt ist; 

z^jsatzliche Sicherheitsmechanismen konnen zusatzlich durch Verschlusselung 
irjnplementiert werden. 

15 

Im Einzelnen geht man zur Kennzeichnung von gentechnisch erzeugten Oder veranderten 
Erzeugnissen beispielsweise folgendermaBen vor: 

Zur Herstellung von Markern wird eine beHebige geeignete Grammatik, z.B. wie die fur den 
Zufallszahlengenerator, das 1-Byte Alphabet oder fur Zeichenketten bereits beschriebene, 
20 verwendet. Aus den mit der Grammatik erzeugten Zeichen werden die zur Darstellung von 
Markern bendtigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis 
hinzugefugt. Dazu konnen die als Logomere hergestellten Zeichen auf folgende Weise in das 
zu kennzeichnende Erzeugnis eingebracht werden: 

a) durch Beimischung; hierbei werden Logomere, wie in den erfindungsgemaBen Verfahren 
25 beschrieben, hergestellt, isoliert und vervielfaltigt. 

b) durch Klonierung, wie im erfindungsgemaBen Verfahren beschrieben; Abbildung 6 zeigt 
z.B. die Kennzeichnung bakterieller Klone durch Logomere, die durch Verwendung der 
bereits beschriebenen Grammatik fur den Zufallszahlengenerator hergestellt wurden. 

c) durch Restriktion und Ligation; hierbei werden Logomere erfindungsgemaB hergestellt, 
30 isoliert und vervielfaltigt. Die solcherart gewonnenen Logomere werden jetzt durch 

Restriktion und Ligation mit der zu kennzeichnenden Nukleinsaure verbunden. Dazu 
konnen die oben beschriebenen Terminatoren (siehe Abbildung 2) und Adaptoren (siehe 
Abbildung 30) gewunschte Restriktionssites tragen. 

d) durch den Einsatz rekombinativer Techniken; hierbei werden Logomere erfindungsgemaB 
35 hergestellt, isoliert und vervielfaltigt. Die solcherart gewonnenen Logomere werden jetzt 

durch den Einsatz rekombinativer Techniken in das zu kennzeichnende Erzeugnis 
eingebracht. Dazu kann z. B. die Methoden des Gene-Targeting durch homologe 
Rekombination [Capecchi M.R., Altering the genome by homologous recombination. 
Science, 244(4910), 1288-1292, (1989)] Oder z.B. das Cre-loxP System [Kilby, N. J., 
40 Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, 

Trends Genet, 9, 413-421, (1993)] verwendet werden. Z.B. konnen erfindungsgemaB 
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erhaltene Logomere mit Hilfe dieser Techniken vor oder hinter eine bestimmte 
Nukieinsauresequenz (Gen) gesetzt werden, die sie bezeichnen sollen. In diesem Falle 
wird ein Logomer gewissermaBen als "Etikett" an. ein gentechnisches Produkt 
"angeheftet" und kann Auskunft uber Hersteller, Produktgruppe, Gefahrenklasse, 
5 Verfallsdatum o.a. geben (siehe Abbildung 15). 

Das Verfahren eigent sich insbesondere zur Kennzeichnung einzelner Molekule, insbesondere 
einzelner Nukleinsauren, besonders bevorzugt einzelner Gene. 

Das Verfahren eignet sich z.B. fur alle Organismen (Mikroorganismen, Pflanzen, Tiere). Z.B. 
10 lassen sich Klone von Mikroorganismen oder Pflanzen kennzeichnen. Das Verfahren eignet 
sich auch fur die Kennzeichnung von Lebensmitteln und fur die Kennzeichnung von Rindern 
zur Bekampfung der Rinderseuche BSE. 

f 

i 

15 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung 
von Nahrungsmitteln 

Aufgrund von Krankheiten, Seuchen oder Kontaminationen konnen Nahrungsmittei 
gesundheitsschadlich oder gefahrlich sein. Beispiele sind Krankheiten wie BSE, 
20 Schweinepest, Salmonellenvergiftungen. Es kann wunschenswert sein, Produkt und Hersteller 
identifizieren zu konnen, um notfalls bestimmte Produkte und Produktreihen umgehend aus 
dem Handel zu nehmen, untersuchen zu konnen und geeignete GegenmaBnahmen zu 
ergreifen. 

Fur hochsensible Erzeugnisse wie Nahrungsmittei gelten dabei die Kriterien fur die 
25 Kennzeichnung gentechnischer Erzeugnisse insbesondere (siehe: Die oben beschriebenen 
Verfahren ermoglichen beispielsweise die Kennzeichnung einzelner Molekule, Nukleinsauren 
und gentechnisch hergestellter oder veranderter Erzeugnisse). 

Insgesamt gibt es auch fur gentechnisch hergestellte Nahrungsmittei bisher kein universelles 
Kennzeichnungsverfahren. Bisher ist die Identifikation gentechnisch hergestellter oder 

30 veranderter Bestandteile in Nahrungsmitteln daher noch schwierig und aufwendig. Es werden 
dazu "klassische" moiekularbiologische Methoden wie PCR, Restriktionsverdau, Southernbiot- 
Hybridisierung und Sequenzierung verwendet, um diese Erzeugnisse zu charakterisieren. 
Aufgrund der Rinderseuche BSE wurde speziell fur die Kennzeichnung von Rindem und deren 
Produkten (Rindfleisch und Milch) ein immunologisches Kennzeichnungsverfahren 

35 vorgeschlagen, das auf der Immunisierung der zu markierenden Tiere mit spezifischen 
Proteinen basiert fOhrmarke im Blut soil BSE Rinder aufspuren", Suddeutsche Zeitung Nr. 
283, 08.12.1998, Seite v2/9). Durch die dadurch verursachte Produktion spezifischer 
Antikorper im jeweils gekennzeichneten Zieltier, die mutmaBlich in alien Geweben 
nachzuweisen ist, kann die Kennzeichnung uber einen Immun-Assay (ELISA) wieder gelesen 

40 werden. Ein solches Verfahren ist jedoch prinzipiell auf hohere Wirbeltiere beschrankt. 
AuBerdem ist die fur das Verfahren verfugbare Informationsmenge sehr begrenzt, die 
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informationstragenden Proteine sind nicht hitzebestandig und das Verfahren erfordert 
vergleichsweise hohe Mengen Substanz fur Immunisierung und Nachweisreaktion. 

Auch im Fall von Nahrungsmitteln konnen Logomere auf Nukleinsaurebasis, wie bereits unter 
5 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung einzelner 
Molekule, Nukleinsauren und gentechnisch hergestellter Oder veranderter Erzeugnisse 
beschrieben, zur Kennzeichnung eingesetzt werden. Logomere konnen dabei Informationen 
uber Hersteller, Verfallsdatum, Serlennummer u.a. enthalten. Das Verfahren zur 
Kennzeichnung von Nahrungsmitteln ist dabei dasselbe, wie bereits unter Die oben 
1 0 beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung einzelner Molekule, 
Nukleinsauren und gentechnisch hergestellter Oder veranderter Erzeugnisse 
beschrieben. Mithilfe der dort aufgefuhrten gentechnischen Rekombinations- und 
Klonierungstechniken konnen einzelne d)rganismen gekennzeichnet werden, sodaB ein 
einzelner Organismus sowie alle seine Nachfahren identifizierbar sind. 
1 5 Das Kennzeichnungsverfahren durch Logomere ermdglicht dadurch: 

ein Monitoring des Zielproduktes uber den gesamten Herstellungs- und 
Verarbeitungsprozesses bis zum Endverbraucher, 

eine einheitliche, schnelle und einfache Identifikation einzelner Bestandteile. 

20 Als Beimischung eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung von 
Getranken. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung 
25 medizinischer und pharmazeutischer Produkte 

Aufgrund der Nichttoxizitat eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung 
sensibler und hochsensibler Erzeugnisse. Neben Nahrungsmitteln sind dies auch 
medizinische und pharmazeutische Produkte. Urn Verwechselungen, Kontaminationen und 
30 Falschungen ausschlieBen zu konnen, konnen Logomere z.B. medizinischen und 
pharmazeutischen Produkten beigemischt werden. 

Der Vorteil der Kennzeichnung durch Logomere ist dabei, daB die Kennzeichnung unmittelbar 
mit dem gekennzeichneten Erzeugnis verbunden ist und daB sich Erzeugnisse z.B. individuell 
kennzeichnen lassen. Auf diese Weise ist ein Monitoring des Herstellungsprozesses moglich, 
35 Erzeugnisse lassen sich auch nach mehrmaligem Umfullen eindeutig identifizieren und 
Kontaminationen sowie das Poolen von Proben konnen nachgewiesen werden. Mithilfe von 
Logomeren laBt sich z.B. im Falle von Blutkonserven Herstellungs- und Verfallsdatum, 
Blutgruppe und Hersteller kennzeichnen. 

40 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise Authentifizierung und 
Falschungssicherung 

Logomere konnen zur Authentifizierung von Erzeugnissen, Gegenstanden und Geraten 
5 verwendet werden. Dazu werden Logomere vorzugsweise erfindungsgemaB erzeugt und 
vervielfaltigt. 

Werden solcherart erhaltene Logomere auf Erzeugnisse, Gegenstande und Gerate an-/ 
aufgebracht Oder zugemischt, so konnen die in Lbgomeren enthaltenen erfindungsgemaB 
jederzeit wieder ausgelesen werden. Sollten zur Erzeugung der Logomere 
10 Verschlusselungstechniken verwendet werden, wie bereits beschrieben, so erfordert das 
Auslesen autorisierten Zugriff. 

Beispielsweise konnen erfindungsgemaB erhaltene Logomere in wassriger Losung 
(vorzugsweise zu 10 3 bis 10 18 Molekulen//;!) unmittelbar zur Kennzeichnung auf Dokumente 
aufgebracht werden. Als solches konnen sie als Echtheitszertifikat des solcherart markierten 

15 Dokumentes dienen. Zum Auslesen der als Kennzeichner dienenden Logomere wird einfach 
ein kleines Schnipsel des Papiers (1mm 2 ist ausreichend) als Template einer 
erfindungsgemaBen PCR-Auslesereaktion verwendet. Ein Beispiel findet sich in Abbildung 16. 
In dem zugrundeliegenden Ausleseexperiment wurde zum Test des Prinzips ein Logomer in 
wassriger Losung in ca. 10 9 Molekulen///l auf 3M Postlt Papier ca. 1 Stunde getrocknet und 

20 1mm 2 des PosMts als Template einer Auslese-PCR verwendet. Es konnen Dokumente 
beliebiger Papierqualitat verwendet werden, z.B. 80g/m 2 Standardkopierpapier. 
Dasselbe Verfahren eignet sich auch zur Kennzeichnung von Geld oder Geldscheinen. wobei 
hier Vorteile darin bestehen, 

auch bereits gedruckte Scheine markieren zu konnen, 

25 - Seriennummern vergeben zu konnen, 
Verschlusselung einzusetzen. 

Urn Dokumente moglichst in Echtzeit auf Authentizitat prufen zu konnen, kann einer der zum 
Auslesen in der PCR benutzten Primer auch a!s Hybridisierungsonde fur eine nachfolgende 
30 Farbe-Nachweisreaktion (z.B. mit einem interkalierenden Farbstoff, z.B. Ethidiumbromid) 
verwendet werden. 

Ein weiteres Beispiel ist die Authentifizierung flussiger Losungen, Suspensionen und 
Emulsionen mit Logomeren. So kann etwa Tinte mit Logomeren individuell markiert werden, 
so daB Unterschriften damit auf Echtheit uberpruft werden konnen. 

35 Ein weiteres Beispiel ist die Kennzeichnung von Automobilen durch das Versetzen des 
Autolackes mit Logomeren. Dabei werden Logomere dem Autolack (oder anderen 
Bestandteilen des KFZ) als Beimischung zugesetzt. Die zugesetzten Logomere konnen dabei 
Informationen uber Seriennummer, Hersteller, Fahrzeugtyp o.a. Angaben enthalten. Aufgrund 
dieser Informationen kann im Falle von Unfall, Diebstahl oder illegaler Entsorgung ein 

40 Fahrzeug identifiziert werden. Ein Vorteil der hier beschriebenen Methode liegt darin, daB 
schon Lackspuren zur Identifikation des Fahrzeuges ausreichen, was insbesondere bei 
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Unfallen von Interesse sein kann. Ein weiterer Vorteil ist, daQ die Identitat eines Fahrzeuges 
nur sehr aufwendig zu falschen ist. Dazu muBten erstens alle gekennzeichneten Bestandteile 
entfernt, zweitens eine gefalschte Identitat eingerichtet werden. Dieses Unterfangen 1st alleine 
durch den mechanischen Aufwand sehr schwierig, auBerdem laBt sich durch den Einsatz 
5 kryptografischer Methoden das Nachmachen und Nachahmen von Kennungen beliebig 
erschweren. Zum Auslesen der als Logomere enthaltenen Informationen, werden die 
Logomere aus dem Lack isoliert und konnen dann wie in der Beschreibung zum Auslesen der 
in Logomeren enthaltenen Information, vorzugsweise durch PCR, ausgelesen werden. Dazu 
wird eine Probe des Lackes entnommen, mit einem geeigneten Losungsmittel (Terpentin o.a.) 

10 gelost und mit gleichem Volumen Wasser versetzt. Durch nachfolgende Zentrifugation werden 
hydrophile und hydrophobe Bestandteile getrennt. Daraufhin nimmt man die wassrige Phase 
auf {worin sich die hydrophilen nukleinsaurebasierten Logomere befinden) und fallt die 
enthaltenen Logomere nach den ublichen Methoden (z.B. wie in [J. Sambrook, E. F. Fritsch, 
T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Nach der Fallung 

15 konnen die erhaltenen Logomere nach den erfindungsgemaBen Verfahren, z.B. durch 
Auslese-PCR, ausgelesen werden. 

Daher sind weitere Gegenstande der vorliegenden Erfindung die Verwendungen 
informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 

20 informationstragenden Polymere, zum Zwecke der Qualitatssicherung, der 
Falschungssicherung, der Kennzeichnung von Lebensmitteln, der Kennzeichnung 
gentechnischer, chemischer, medizinischer und pharmazeutischer Erzeugnisse, der 
Kennzeichnung von Organismen, der Kennzeichnung von Dokumenten, der Kennzeichnung 
von Geld, der Kennzeichnung von Gegenstanden und Maschinen, der Kennzeichnung von 

25 Losungen, Suspensionen und Emulsionen sowie der Authentifizierung von Personen und 
Gegenstanden. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von 
30 Molekulargewichtsstandards 

Zu den typischen Verfahren der molekularbiologischen Analytik gehort die elektrophoretische 
Langenauftrennung von DNA- und RNA-Fragmenten. Urn die Lange soicher Fragmenten bei 
der Elektrophorese zu bestimmen, verwendet man ublicherweise einen 
35 Molekulargewichtsstandard ("Leiter"), der Fragmente bekannter Lange enthalt und zum 
Vergleich mit den Fragmenten der zu analysierenden Proben dient. 

Bisher gibt es Molekulargewichtsstandards, die entweder unregelmaBige Leitem enthalten 
(z.B. Boehringer V, Boehringer Mannheim, Katalog Nr.: 821 705) oder regelmaBige Leitem mit 
regelmaBigen Fragment-Langenabstanden (z.B. 50bp Leiter Gibco BRL, Life Technologies, 
40 Katalog Nr. 10416-014). Keine der bisherigen Leitern hat dabei kurzere Langenabstande als 
10bp (z.B. 10bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10821-015). 
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Mit den hier beschriebenen Verfahren konnen gezielt DNA Fragmente verschiedener Lange 
und definierter Langenabstande hergestellt werden. Diese Fragmente konnen ais 
Molekulargewichtsstandards genutzt werden, wobei das Verfahren erlaubt, prinzipiell beliebige 
Langen und beliebige Langenabstande zu realisieren. Insbesondere sind Langenabstande bis 
5 hinab zu 1bp Abstand, also Molekulargewichtsstandards hochster Aufldsung, moglich. 

Das Verfahren beruht darauf, Logomere als Template einer Auslese-PCR zu verwenden, 
deren Resultat ein Gemisch von DNA Fragmenten definierter Lange und definierter 
Langenabstande ist. Es basiert auf den bereits beschriebenen erfindungsgemaBen Verfahren 
zur Erzeugung und dem Auslesen von Logomeren. 

10 DNA Fragmente verschiedener Lange in sehr kurzen, regelmaBigen Abstanden konnen 
erhalten werden, wenn ein unares Polymer als Template einer Auslese-PCR mit 
verschachtelten Primern fungiert. Der 5'-Primer primt in der Start-Sequenz des Polymers. Als 
gegenlaufige 3* Primer fungiert eine Gruppe von Primern, die verschachtelt in dem Eloqbator 
ansetzt (in Abbildung 17 dargestellt als 3 Ebenen gegeneinander versetzter Primer). Da das 

15 Polymer aus Wiederholungen nur eines Elongator-Molekuls besteht, erhalt man fur n 
Wiederholungen und m verschachtelte 3* Primer n*m Banden. Das Verfahren funktioniert 
auch spiegelbildlich mit einem im Ende-Terminator primenden Primer und dementsprechen 
gegenlaufigen 5' Primern. Die erhaltenen Banden konnen als Molekulargewichtsstandards 
z.B. in Elektrophoresen eingesetzt werden. 

20 

Fur hochauflosende Molekulargewichtsstandards ist die Verwendung unarer Logomere und 
verschachtelter Primer am zweckmaBigsten. Jedoch ist das Verfahren nicht darauf 
beschrankt, da im Prinzip alle im erfindungsgemafBen Schritt I beschriebenen Grammatiken 
verwendet werden konnen. 
25 Unare Logomere beliebiger Lange konnen mit einer Grammatik G = (£, V, R, S) mit 
Terminalalphabet Z:= {0 t s, e}, Variablenmenge V:={A}, Startsymbol S und Regelmenge 
R:= 
{ 

S:=sA 
30 A->aA 
A->e 

} 

hergestellt werden. Sollte es notig sein, unare Logomere definierter Lange herzustellen, mu3 
dementsprechend die Variablenmenge und damit auch die Zahl der Elongatoren groBer 
35 gewahlt werden (wie z.B. in der Grammatik zur Implementierung eines 1-Byte Alphabets 
bereits beschrieben). Je nach gewunschter Lange der zu erzeugenden DNA Fragmente kann 
auBerdem die Lange der Algomere variiert werden. 

Die so erzeugten Logomere konnen nach den erfindungsgemaBen Verfahren vereinzelt und 
vervielfaltigt werden. 

40 Das Erzeugen von DNA-Fragmenten definierter Lange und definierter Langenabstande erfolgt 
vorzugsweise mit PCR analog dem erfindungsgemaBen Verfahren zum Auslesen von 
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Logomeren. Fur hochauflosende Molekulargewichtsstandards wird pro Elongator mindestens 
ein Primer, meistens sogar eine Anzahl mehrerer Primer verwendet, die gegeneinander 
verschoben sind. Die Anzahl der Primer pro Elongator ist abhangig von den gewunschten 
Langenabstanden. Ist etwa gewunscht, Algomere der Lange 30bp zu verwenden und sollen 
die Langen der erzeugten DNA Fragmente jeweiis 10bp Unterschied haben, so sind pro 
Elongator drei Primer, die jeweiis genau 10bp gegeneinander verschoben sind, eingesetzt 
werden. 

Fur die Synthese von Sequenzen zur Herstellung von Algomeren und Logomeren mussen die 
Anforderungen erfullt werden, die bereits unter Schritt II des erfindungsgemaBen Verfahrens 
beschrieben wurden. Insbesondere gewahrleistet das verwendete NFR-Vertahren dadurch, 
daB die jeweiis als Template dienenden Teilsequenzen einen gleichen GC-Anteil besitzen 
konnen, den Einsatz verschachtelter Primer und die Ausgewogenheit des AT/GC 
Verhaltnisses der erzeugten DNA Fragmente. Letzteres ist insbesondere angesichts dessen 
entscheidend, daB das Laufverhalten von DNA Fragmenten in der Elektrophorese nicht nur 
von der Lange, sondern auch von der Zusammensetzung der Fragmente abhangt. Dies gilt 
insbesondere fur hochauflosende Molekulargewichtsstandards in denen es nur sehr geringe 
Langenabstande gibt. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere, insbesondere der erfindungsgemaB eihaltlichen 
informationstragenden Polymere, zur Herstellung von Molekulargewichtsstandards. 



Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung 
25 polymerer Datenspeicher 

Die beschriebenen Logomere konnen als RAM (Lesen und Schreiben) und ROM (nur Lesen) 
Datenspeicher hoher Kapazitat und niedrigen Energieverbrauchs genutzt werden. Urn eine 
moglichst hohe Informationsdichte zu gewahrleisten und die Handhabung des Speichers 
30 moglichst einfach zu machen, werden die Logomere an einen festen Trager gebunden. Dies 
gewahrleistet, daB die Logomere einzeln adressiert, d.h. einzeln geschrieben, gelesen und 
geloscht werden konnen (siehe Abbildung 9). 

Die benotigten Schreib- und Leseoperationen werden auf der Basis der im 
erfindungsgemaBen Schritt V und der unter Auslesen der in Logomeren enthaltenen 
35 Information beschriebenen enzymatischen Reaktionen durchgefuhrt, die ihrerseits durch 
Temperaturanderungen gesteuert werden. Die Temperaturanderungen konnen entweder per 
Laser Oder durch Erhitzen und Abkuhlen des festen Tragers z.B. in einem Thermozykler 
durchgefuhrt werden. 

2um Schreiben wird eine Modifikation des oben beschriebenen Verfahrens der 
40 Symbolpolymerisation verwendet. Die Polymerisation findet an einem festen Trager statt, die 
Algomere werden durch wiederholte Restriktions-Ligationszyklen miteinander verkettet. 
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Urn einzelne. adressierbare Speicherzellen herzustellen, werden in bestimmten Abstanden 
einzelstrangige "Ankermolekule" irreversibel (durch UV-Bestrahlung oder im Ofen) an den 
Trager gebunden. Der solcherart mit Ankermolekulen versehene Trager kann nun reversibel 
mil Logomeren beschrieben werden, die in einem Loschvorgang wieder davon entfernt 
5 werden konnen. 

Bei einem Schreibvorgang werden zuerst spezifische Algomere ("Starter-Algomere") durch 
Hybridisierung an die Ankermolekule gebunden. Diese Starter-Algomere sind ihrerseits 
Ausgangspunkt einer Symbolpolymerisation, bei der weitere Algomere miteinander verkettet 
werden. Die Verkettung der Algomere erfolgt dabei, abweichend von dem im Schritt V des 
10 erfindungsgemaBen Verfahrens beschriebenen Vorgehen, durch wiederholte Zykien von 
Restriktion und Ligation. Bei jedem Zyklus wird das jeweils letzte Algomer einer 
polymerisierenden Kette mit einem Restriktionsenzym geschnitten, so daB eine 
einzelstrangige Uberhangsequenz (Elongationspunkt) entsteht, an die seinerseits das 
nachstfolgende Algomer durch Ligation gebunden werden kann. 

15 

Fur den solcherart beschriebenen Schreibvorgang mussen die Algomere ein spezifisches 
Design aufweisen: 

a) Jedes zu schreibende Algomer besitzt eine einzelstrangige Uberhangsequenz, mit der es 
an den Elongationspunkt eines Logomers binden kann. 
20 b) Ein Algomer, das nur eine einzelstrangige Uberhangsequenz besitzt mit der es an einen 
Elongationspunkt binden kann, selbst aber keine Restriktionsschnittstelle besitzt, durch 
die es von Restriktionsenzymen erkannt werden kann und damit nicht als 
Elongationspunkt dienen kann, heiBt Ende-Algomer. 

c) Jedes zu schreibende Algomer, das nicht das Ende-Algomer ist, besitzt ein 
25 doppelstrangiges Ende, worin sich die Erkennungssequenz fur das jeweils gewahlte 

Restriktionsenzym befindet. Bei einer Restriktion spaltet das Erizym das Algomer, so daB 
eine einzelstrangige Uberhangsequenz entsteht, die ihrerseits selbst wieder als 
Elongationspunkt dienen kann. 

d) Jedes fertige Logomer besitzt genau ein Starter- und ein Ende-Algomer. Starter- und 
30 Ende-Algomere sind, entsprechend der oben gegebenen Definition, Terminatoren. 

e) Die Uberhangsequenzen der Algomere sind kompatibel zu einem jeweils gewahlten 
Restriktionsenzym, so daB ein zu verkettendes Algomer an den Elongationspunkt eines 
Logomers binden kann und der nachfolgend durch Restriktion entstehende 
Elongationspunkt identisch zu seinem Vorlaufer ist. 

35 f) Die im Algomer auf die Uberhangsequenz folgende Sequenz ist solcherart gewahlt, daB 
ein verkettetes Algomer durch einen nachfolgenden Restriktionsvorgang nicht wieder 
abgespalten werden kann. 

Als fester Trager eignen sich Membranen wie Gene Screen Plus (DuPont, Biotechnology 
40 Systems, Katalog Nr.: NEF-986 oder NEF-987), Hybond-N (Amersham Life Sciences, Katalog 
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Nr.: RPN 82N Oder RPN 137N), Silizium-, Silicat-Oberflachen Oder Glas. Die Ankermolekule 
werden jeweils kovalent daran gebunden (UV-Bestrahlung oder Hitze). 

Damit die Molekule einzeln adressierbar sind, mussen sie in regelmaBigen Abstanden auf 
dem Trager angebracht werden. 
5 Als Restriktionsenzyme eignen sich handesubliche Enzyme, vorzugsweise solche, die nicht 
bei 65°C deaktiviert werden (z.B. Hindlll). 

Die Schreiboperationen basieren darauf, daB die zum Schreiben verwendeten Enzyme 
unterschiedliche Temperaturoptima haben. So liegt das Temperaturoptimum der zum 
Verketten von Symbolen verwendeten Ligase bei 16°C, wohingegen die benotigten 
10 Restriktionsenzyme nur bei 37°C funktionieren. Dadurch ist das getaktete Schreiben von 
Symbolen in Zyklen von Restriktion und Ligation moglich. 

Da alle Lese- und Schreiboperationen mithilfe von Enzymen durchgefuhrt werden, ist es notig, 
den Trager temperieren zu konnen. Dabei konnen, bei der Verwendung eines Thermozyklers 
und therrnomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation 

15 unterworfen werden. Altemativ konnen Speicherzellen einzeln und unabhangig voneinander 
zugegrtffen werden, wenn ein entsprechend kleiner SchreibVLesekopf eingesetzt wird. Dieser 
SchreibVLesekopf muB einerseits als Pipettiervorrichtung fur die benotigten Molekule 
(Enzyme, Algomere) dienen und andererseits die fur eine bestimmte Manipulation benotigte 
Temperatur erzeugen (z.B. mit Hilfe eines Lasers). 

20 Beim Loschvorgang wird ein Logomer durch Denaturierung vom jeweiligen Ankermolekul 
gelost. Das Ankermolekul steht danach wieder fur einen Schreibvorgang zur Verfugung. Fur 
einen Lesevorgang wird ein Logomer durch Denaturierung von einem Ankermolekul gelost. 
Es kann dann nach den erfindungsgemaBen Verfahren ausgelesen werden. 
Die beschriebenen Operationen Schreiben, Loschen, Lesen werden durch Enzyme bei 

25 verschiedenen Temperaturen durchgefuhrt. Dabei konnen, bei der Verwendung eines 
therrnomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation 
unterworfen werden. Altemativ konnen Speicherzellen einzeln und unabhangig voneinander 
zugegriffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser 
SchreibVLesekopf muB einerseits als Pipettiervorrichtung dienen und andererseits die fur eine 

30 bestimmte Manipulation benotigte Temperatur erzeugen. 

Der Vorteil des hier vorgestellten Polymerspeichers besteht gegenuber den bisher 
verwendeten Materialien in einer hoheren Speicherdichte (DNA Molekule haben eine GroBe, 
die bei 10~ 10 m liegt), und einem sehr viel geringeren Energieverbrauch (zur Berechnung der in 
35 enzymatischen Reaktionen benotigten Energie siehe [L. M. Adleman, Molecular Computation 
of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)]). AuBerdem ergibt 
sich eine erheblich verbesserte Umweltvertraglichkeit, weii die hier beschriebenen Polymere 
Biomolekule ohne jegliche Toxizitat sind. 

Der hier beschriebene Ansatz hat gegenuber den bisher fur das DNA Computing verwendeten 
40 wassrigen Losungen den Vorzug hoherer Speicherdichte und der Adressierbarkeit einzelner 
Polymere. 
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Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein polymerer Datenspeicher, 
umfassend erfindungsgemaBe informationstragende Polymere, erfindungsgemaBe Verfahren 
zur Verknupfung von Molekulen, erfindungsgemaBe Ausleseverfahren Oder 
5 erfindungsgemaBe Isolierungs- und Vervielfaitigungsverfahren. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung eines 
DNA Computers 

10 

Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere 
kann ein DNA Computer konstruiert werden. Der DNA Computer umfaBt (s. Abbildung 10): 

a) Oligonukleotidsynthesizer 

b) Thermozykler 

1 5 c) Pipettiervorrichtung 

d) Vorrichtung zur Isolation von Polymeren 

e) Vorrichtung zur Auftrennung von Nukleinsauren, z.B. Elektrophoresesystem 

f) Scanner 

g) Steuerungsrechner (Workstation, z.B. PC) 

20 Der DNA Computer ist konstruiert als ein Hybridsystem, bei dem einfache, rechenintensive 
Algorithmen oder die Speicherung von Daten mithilfe von DNA und den dazu benotigten 
Geraten (Gerate a) bis e)) vorgenommen werden und ein herkommlicher Computer 
(vorzugsweise Workstation, z.B. PC) als Host und Steuerungsrechner dient. 
Der DNA Computers beinhaltet mindestens einen Thermozykler, der als Jnformationsreaktor 41 

25 dient und uber den Steuerungsrechner gesteuert werden kann (z.B. MJ Research PTC-100, 
Eppendorf Mastercycler). In den Tubes Oder Mikrotiterplatten des Thermozyklers befinden 
sich Molekulgemische aus Nukleinsauren, Enzymen und weiteren chemischen Substanzen 
(z.B. Puffer, Nukleotide), die fur die Algomer-Assemblierung (Schritt IV des 
erfindungsgemaBen Verfahrens) und die Symbolpolymerisation (Schritt V des 

30 erfindungsgemaBen Verfahrens) benotigt werden. Programmiert wird der DNA Computer 
durch die Implementierung von Algorithmen als Grammatiken (Schritt I des 
erfindungsgemaBen Verfahrens). Die fur die Grammatiken jeweils benotigten 
Monomersequenzen werden durch das NFR- Verfahren und die Benutzung eines 
Oligonukleotidsynthesizers (z.B. AB! 392, ABI 398, ABI 3948 von Perkin-Elmer Applied 

35 Biosystems) hergestellt (Schritte II und III des erfindungsgemaBen Verfahrens). Diese 
Monomersequenzen gehen als Input in den Thermozykler ein, in dem die Algomer- 
Assemblierung (Schritt IV des erfindungsgemaBen Verfahrens) stattfindet. 
Die so gewonnenen Algomere werden in eine oder mehrere Reaktionskammern des 
Thermozyklers uberfuhrt, wo sie zu Logomeren verknupft werden (Symbolpolymerisation, 

40 Schritt V des erfindungsgemaBen Verfahrens). Die so gewonnen Logomere werden in einer 
eigenen Vorrichtung isoliert und vervielfaltigt. Diese Vorrichtung kann nach den Prinzipien 
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arbeiten, die in dem erfindungsgemaBen Verfahren beschrieben worden sind. Nach lsolierung 
und Vervielfaltigung konnen die Logomere gelesen werden. Dazu werden sie wiederum in 
einem Thermozykler erfindungsgemaB ausgelesen. Die aus dem Ausleseverfahren 
resultierenden Nukleinsaurefragmente konnen, wie bereits beschrieben, durch 
5 Gelelektrophorese gelesen werden. Hier dient das Gelelektrophoresegerat als Ausgabegerat 
des DNA Computers, die solcherart erhaltenen Bandenmuster werden von einem Scanner in 
den Steuerungsrechner eingelesen. 

Der Steuerungsrechner nimmt jetzt seinerseits aufgrund der solcherart erhaltenen Ergebnisse 
weitere Berechnungen und Steuerungen vor und setzt ggfs. weitere moiekuiare Reaktionen in 

10 Gang. Z.B. kann der Steuerungscomputer aufgrund erhaltener Ergebnisse die 
Neuimplementierung von Grammatiken (Herstellung von Oligomeren mit dem NFR- 
Verfahren) veranlassen. Auf diese Weise konnen die durch moiekuiare Verfahren als 
Logomere erhaltenen Informationen nicht nur als passive Daten sondern auch als 
Instruktionen (und Adressen) dienen. Dadurch ist ein sich selbst steuemder ProzeB 

15 verschiedener Algorithmen moglich, der fur eine universelle Datenverarbeitung notig ist. 

Der DNA Computer verarbeitet dabei Informationen als Oligo- und Polymere. Als 
Speicherzellen der Daten dienen Klonierungsvektoren (Plasmide), die sich in flussiger Losung 
Oder auf einem festen, adressierbaren Trager befinden. 

Der DNA Computer ist wie oben beschrieben mittels Grammatiken programmierbar und kann 
20 von einem herkommlichen Computer, der als Steuerungsrechner und Host-System fungiert, 
gesteuert werden. 

Da der DNA Computer bestimmte Operationen in molaren GroBenordnungen (z.B. die 
Symbolpolymerisation, wie in Schritt V des erfindungsgemaBen Verfahrens beschrieben, in 
10 12 - 10 20 Elementaroperationen pro Sekunde) vomehmen kann, ist eine mogliche 
25 Anwendung die Berechnung einfacher, rechenintensiver Algorithmen. Jedoch kann der DNA 
Computer auch fur andere Anwendungen, z.B. die Erzeugung bestimmter, regelmaBiger DNA 
Strukturen, die z.B. innerhalb der Nanotechnologie interessant sind, verwendet werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein DNA-Computer, umfassend 
30 erfindungsgemaBe informationstragende Polymere. Ein weiterer Gegenstand der 
vorliegenden Erfindung ist ein DNA-Computer, in dem ein erfindungsgemaBes 
Ausleseverfahren und/oder erfindungsgemaBe Isolierungs- und Vervielfaltigungsverfahren 
eingesetzt werden. 

35 
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Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung 
kleinster molekularer Strukturen mit Logomeren 

Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen 
5 (Nanostrukturen) herstellen. Bausteine solcher Strukturen sind Aigomere, die zu 
regelmaBigen Mustern von Logomeren zusammengefugt werden konnen. Z.B. konnen 
verschiedene Algomere mit unterschiedlichen Fremdmoiekulen (Liganden) dotiert werden, um 
regelmaGige, hohermolekulare Muster der jeweiligen Liganden zu erhalten. Die Logomere 
fungieren dabei als "Skelett" molekularer Baugruppen von Liganden. 
10 Z.B. konnte ein binares Logomer alternierende Muster leitfahiger und nicht-leitfahiger 
Liganden enthalten. Durch die Anordnung vieler Logomere auf einem festen Trager konnen 
so Leiterbahnen im Nanometerbereich entstehen. 

Als Liganden konnlen aber auch Biomolekule, Antikorper, optisch aktive Molekule o.a. 
verwendet werden. , 

15 

Logomere konnen als "intelligenter" Klebstoff eingesetzt werden (siehe Abbiidung 18). Dabei 
macht man sich die Hybridisierung komplementarer Nukleotide zunutze. Bringt man auf die zu 
verklebenden Flachen Logomere auf, die etwa kovalent an die zu verkiebenden Flachen 
gebunden werden, so konnen ansonsten vollig identische Flachen nur dann verkleben, wenn 

20 sie komplementare Sequenzen aufweisen, da nur jeweils Flachen komplementarer 
Nukleinsauren Wasserstoffbruckenbindungen ausbilden. Die "Intelligenz" des Klebstoffes 
besteht also in einer durch die jeweils verwendeten Sequenzen hochselektiven 
Adhasionswirkung. Dabei kann auch die Adhasionsstarke fur zu verklebende Fiachen genau 
eingestellt werden: Zum einen kann uber die Dichte der Logomere auf den jeweiligen Flachen 

25 deren Adhasionsstarke eingestellt werden, zum anderen kann uber das AT/GC Verhaltnis der 
Logomere deren Schmelzpunkt variiert werden, so daB verklebte Flachen bei 
unterschiedlichen Temperaturen ihre Adhasion verlieren. Aufgrund der Tatsache, daB hier 
unschadiiche, leicht abbaubare Biomolekule als Klebstoff verwendet werden, konnen derartige 
Klebstoffe auch zur medizinische Verwendung (z.B. Chirurgie, Mikrochirugie) eingesetzt 

30 werden. Eine andere Verwendung ist die Nutzung des beschriebenen Verfahrens in 
Hochprazisions- und Authentifizierungsanwendungen. 

Versetzt man die zur Herstellung von Logomeren verwendeten Algomeren mit Sequenzen zur 
Bindung von Liganden, so konnen starkere Adhasionswirkungen erreicht werden. Solche 
Liganden konnen im Falle von DNA DNA-bindenden Proteinen, z.B. spezifische, gegen DNA- 

35 Sequenzen gerichtete Antikorper sein. Diese konnen z.B. jeweils uber einen weiteren 
Liganden untereinander verbunden werden (siehe Abbiidung 19). Eine einfache, nicht- 
programmierbare Adhasionswirkung kann auch ohne Logomere erreicht werden, wenn die 
verwendeten Proteine (z.B. Antikorper) ihrerseits an die zu verklebenden Fiachen binden 
konnen (wie z.B. Antikorper, wenn die zu verklebende Flache ihr Antigen ist). Siehe dazu auch 

40 Abbiidung 20. Einfachere Klebstoffe sind moglich, wenn, an bestimmte Flachen spezifisch 
bindende, Proteine gentechnisch hergestellt werden. 
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Eine alternative Methode besteht darin, die zu verklebenden Flachen nicht uber schwache 
Wechselwirkung, sondern uber kovalente Bindung miteinander zu verbinden. Abweichend 
vom oben vorgestellten Verfahren wird die Adhasionskraft uber die Dichte von Algomeren 
eingestellt Dabei werden die zu verklebenden Flachen mit Algomeren, die zueinander jeweils 
5 komplementare sticky ends tragen versehen. Diese konnen dann hybridisieren und durch 
Ligation miteinander kovalent verbunden werden. 

Mit Logomeren konnen Oberflachen unterschiedlichster Struktur und unterschiedlichster 
physikalischer Eigenschaften hergestellt werden. Den Anwendungen ist gemein, daB sich mit 
10 den Logomeren nahezu beliebige Muster im Nanometerbereich bilden lassen, die das Skelett 
kleinster molekularer Bauelemente sein konnen. 

Ein weiterer Gegenstand der vorltegenden Erfindung ist daher die Verwendung 
^ informationstragender Polymere, insbesondere der erfindungsgemaB erhaltlichen 

15 informationstragenden Polymere, zur Herstellung oder Bearbeitung kleinster molekularer 
Strukturen oder als molekularer Kleber. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung 
nanotechnologischer Baukastensysteme. 

20 

Mit dem oben beschriebenen NFR- Verfahren und dem "Parallel Extension" Verfahren konnen 
erstmals groBere Grammatiken direkt in Molekule ubersetzt werden. Dabei sind diese 
Grammatiken nicht auf regulare Grammatiken beschrankt. U. a. aufgrund der 
Wiederverwendbarkeit von Sequenzen lassen sich damit z.B. auch \|/-Moiekule [Matthias 
25 Scheffler, Axel Dorenbeck, Stefan Jordan, Michael Wustefeld, Gunter von Kiedrowski, Self- 
Assembly of Trisoligonucleotidyls: The Case for Nano-Acetylene and Nano-Cyctobutadiene. 
Angewandte Chemie Int. Ed., 38(22), 3312-3315, (1999)] und DX-Molekule [Erik Winfree, 
Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two- 
dimensional DNA crystals, Nature, 394, 539-544, (1998)] programmieren. 

30 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung des NFR- 
Verfahrens, des "Parallel-Extension" Verfahrens und der Ubersetzung von Grammatiken in 
Molekule zur Herstellung von Komponenten nanotechnologischer Baukastensysteme. 

35 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die kontrollierte, 
programmierbare Herstellung von biologisch aktiven Nukleinsauren. 

Dazu setzt man z.B. als Terminate anstelle kunstlicher Sequenzen zur Darstellung von 
40 Symbolen biologisch aktive Sequenzen wie Restriktionssites, Rekombinationssites, 
Centromere, Promotoren, Exons, Gene o.a. ein. Diese konnen dann auf kontrollierte, 
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programmierbare Weise zu biologisch aktiven Konstrukten, z.B. zu Genen Oder kunstlichen 
Chromosomen zusammengesetzt werden. 



Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung 
informationstragender Polymere. insbesondere der erfindungsgemaB erhaltlichen 
informationstragenden Polymere, zur kontrollierten Herstellung biologisch aktiver 
Nukleinsauren. 
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Patentanspruche 



PCT/EP00/02893 



1 . Verfahren zur Herstellung von informationstragenden Polymeren, das umfaBt, 

eine regulare Grammatik G = (2, V, R, S) mit einem endlichen Terminalalphabet Z, 
einer endlichen Variablenmenge V, einer endlichen Regeimenge R und einem 
Startsymbol S zu definieren; 

das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von 
Monomersequenzen; 

mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, 
indem damit Monomersequenzen hergestellt werden, die die Regeimenge R einer 
Grammatik G eindeutig darstellen; ' 

aus den in Schritt III hergestellten ^Monomersequenzen fur jede Regel der 
Regeimenge R von G ein die Regel reprasentierendes Oligomer zusammenzusetzen; 
die in Schritt IV zusammengesetzten Oligomere zu informationstragenden Polymeren 
zu verknupfen. 

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, da3 das Terminalalphabet £ einer 
Grammatik G die Terminate 0, 1, n Startterminale s (s 0 , S! s n ) und m Endterminale e (e 0 , 

20 e 1f e m ), enthalt, wobei n und m jeweils groBer oder gleich 0 sind und eine naturliche 2ahl 
darstellen. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB die in Schritt 111 
konstruierte Monomersequenz Nukleotide, insbesondere Ribonukleotide, besonders 

25 bevorzugt Desoxyribonukleotide umfaBt. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daB die in Schritt III konstruierte 
Monomersequenz Proteinerkennungssequenzen (z.B. Restriktionsschnittstellen, 
Proteinbindungsstellen, Stopcodons) umfaBt. 

30 

5. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, daB man 
die Synthese der Monomersequenzen in Schritt II und 111 in vitro, vorzugsweise mittels eines 
Oligonukleotid-Synthezisers vornimmt. 



II. 

10 III. 
IV. 

15 V. 
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6. Verfahren zur Isolierung und Vervielfaltigung von informationstragenden Polymeren, die 
nach einem der vorhergehenden Anspruche erhalten wurden, dadurch gekennzeichnet, daB 
man in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren ligiert, 
kompetente Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten 

5 Bakterien anhand von Selektionsmarkern selektioniert. 

7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die nach 
einem der vorhergehenden Anspruche erhalten oder isoliert und vervielfaltigt wurden, 
dadurch gekennzeichnet, daB man 

a) mindestens n-1 das informationstragende Polymer enthaltende Losungen mit jeweils 
einem Paar gegenlaufiger Primer versetzt, wobei n fur die Zahl der als Elongatoren in 
dem Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in 
dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares 
in dem dem Elongator gegenuberliegenden Terminator primt und der andere Primer 
in dem Elongator selbst primt; 

c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Lange durch 
Elektrophorese auftrennt und 

d) das aus der Elektrophorese erhaltene Muster optisch ausliest. 

20 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daB das Auslesen in Schritt d) 
automatisiert durch einen Scanner oder eine Sequenziermaschine erfolgt. 

9. Informationstragendes Polymer, erhalten nach einem der Anspruche 1 bis 6. 

25 10. Zufallszahlengenerator, umfassend informationstragende Polymere, insbesondere 
Polymere nach Anspruch 9. 

1 1 . Polymerer Datenspeicher, umfassend informationstragende Polymere nach Anspruch 9. 
30 12. DNA-Computer, umfassend informationstragende Polymere nach Anspruch 9. 
13. Biochip, umfassend informationstragende Polymere nach Anspruch 9. 



10 



15 
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14. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von 
Molekulargewichtsstandards. 



15. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Darstellung von 
5 Datenstrukturen. 



16. Verwendung von informationstragenden Polymeren, insbesopdere von Polymeren nach 
Anspruch 9 als Marker oder Signaturen. 

10 17. Verwendung von informationstragenden Polymeren, insbesondere yon Polymeren nach 
Anspruch 9 zum Zwecke der Qualitatssicherung. 

i 

18. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Falschungssicherung, 

15 

19. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung gentechnischer Erzeugnisse. 



20. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
20 Anspruch 9 zum Zwecke der Kennzeichnung von Lebensmitteln. 

21 . Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Organismen. 



25 22. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung chemischer Erzeugnisse. 

23. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung medizinischer und pharmazeutischer 
30 Erzeugnisse. 
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24. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Dokumenten. 



25. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
5 Anspruch 9 zum Zwecke der Kennzeichnung von Geld. 



26. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Gegenstanden und Maschinen. 



10 27. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Kennzeichnung von Flussigkeiten, Losungen, Suspensionen 
oder Emulsionen. 



28. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
15 Anspruch 9 zur Verschlusselung von Information. 



29. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zum Zwecke der Authentisierung von Personen und Gegenstanden. 



20 30. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 als molekulare Kleber. 



31. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung 
oder Bearbeitung kleinster molekularer Strukturen. 

25 

32. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur 
Qualitatskontrolle synthetisch hergestellter Oligonukleotide. 



33. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von 
30 Biochips. 
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34. 1 bis n-bytige Nukleinsauren, insbesondere 1 bis n-bytige Nukleinsauren erhalten nach 
einem der Anspruche 1 bis 6. 

35. 1 bis n-bytige Biochips, insbesondere 1 bis n-bytige Biochips erhalten nach einem der 
5 Anspruche 1 bis 6. 

36. Verwendung von Biochips, insbesondere von Biochips nach einem der Anspruche 13, 33 
und 35 als Datenspeicher. 

10 37. Verwendung von Biochips, insbesondere von Biochips nach einem der Anspruche 13, 33 
und 35 zur Herstellung von optischen Anzeigegeraten Oder Bildschirmen. 

38. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zur Kennzeichnung einzeiner Molekule, insbesondere von Nukleinsauren, 

15 besonders bevorzugt von Genen. 

39. Verwendung von Nukleinsauren zur Verschlusselung von Information. 

40. Verwendung von Nukleinsauren zur Verschlusselung von Information, dadurch 
20 gekennzeichnet, daB zur Entschlusseiung kurze Nukleinsauresequenzen (Primer) als 

Schlussel benutzt werden. 

41. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach 
Anspruch 9 zur Verschlusselung von Information, dadurch gekennzeichnet, daB das 

25 informationstragende Polymer in einer Vielzahl anderer Poiymere verborgen ist. 

42. Verwendung von Polymeren zum Zwecke der Kennzeichnung, dadurch gekennzeichnet, 
daB die Poiymere verschlusselt sind. 



30 



43. Herstellung biologisch aktiver Motekule mit kontrolliertem, programmierbaren Verknupfen 
von Sequenzen. 



WO 00/5991 7 PCT/EP00/02893 
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44. Herstellung biologisch aktiver Molekule unter Verwendung von Algomeren. 

45. Verfahren zum Auslesen von Information aus informationstragenden Polymeren die aus 
den Anspruchen 1 bis 6 erhalten Oder isoliert und vervielfaltigt wurden, dadurch 

5 gekennzeichnet, da3 man zum Auslesen Biochips benutzt. 

46. Verwendung des NFR-Verfahrens zur Herstellung von Biochips. 

47. Verwendung des NFR-Verfahrens zur Herstellung nanotechnologischer Komponenten 
10 Oder von Komponenten nanotechnologischer Baukastensysteme. 
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X31 X31U ctagcacctgaagttacgggaagtcc 

X31L catgggacttcccgtaacttcaggtg 

X32 X32U ctagcaacaggttccttacagagggc 

X32L catggcccrctgtaaggaacctgttg 

X33 X33U ctagcacgtagccaagacttatcccc 

X33L catgggggataagtcttggctacgtg 

X34 X3 4U ctagccagtcaggtctattgttgccc 

X34L catggggcaacaatagacctgactgg 

X35 X35U ctagcgagaaccatatcgcccctacc 

X35L catgggtaggggcaatatggttctcg 

X36 X36U ctagccataaagaggagactgggctc 

X3 6L catggagcccagtctcctctttatgg 

X37 X37U ctagccatagtctgcgaatactgccc 

X37L catggggcagtattcgcagactatgg 

X38 X38U ctagcgttagggcagccttaggtaac 
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X3 9L catggcgtcccactgtcacatctatg 
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X4 0L catggagcgccctacaactctaatcg 
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X4 1L catggctatcccacacgtacttccag 

X4 2 X4 2U ctagctgagatagtcgtggatggtcc 

X4 2L catgggaccatccacgactatctcag 

X43 X43U ctagcacgacctgttaccgttacctc 

X4 3L catggaggtaacggtaacaggtcgtg 

X4 4 X4 4U ctagccattgctggaactgctactcc 

X4 4L catgggagtagcagttccagcaatgg 

X4 5 X4 5U ctagcgtaccccacccacataaagtc 

X4 5L catggactttatgtgggtggggtacg 

X4 6 X4 6U ctagcagtgtaggaat acccgtgct c 

X4 6L catggagcacgggtattcctacactg 

X4 7 X4 7U ctagccgttcgctatgttctacagcc 

X47L catgggctgtagaacatagcgaacgg 

X4 8 X4 8U ctagcccctgtccccatacattactc 

X48L catggagtaatgtatggggacagggg 

X4 9 X4 9U ctagcatgtaggcaactgrcgtcacc 

X4 9L catgggtgacgacagttgcctacatg 

X50 X50U ctagcgtatgttcccagcgagtacac 

X50L catggtgtactcgctgggaacatacg 

X51 X51U ctagcgtgtaataccacgggtgttgc 

X51L catggcaacacccgtggtattacacg 

X52 X52U ctagctgtagtggtctttacgtggcc 

X52L catgggccacgtaaagaccactacag 
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X53 
X54 
X55 
X56 
X57 
X58 
X5 9 
X60 
X61 
X62 
X63 
X64 
X65 
X66 
X67 
X68 
X69 
X70 
X71 
X72 
X73 
X7 4 



X53U 
X53L 
X54U 
X54L 
X55U 
X55L 
X56U 
X56L 
X57U 
X57L 
X58U 
X58L 
X59U 
X59L 
X60U 
X60L 
X61U 
X61L 
X62U 
X62L 
X63U 
X63L 
X64U 
X64L 
X65U 
X65L 
X66U 
X66L 
X67U 
X67L 
X68U 
X68L 
X69U 
X69L 
X70U 
X70L 
X71U 
X71L 
X72U 
X72L 
X73U 
X73L 
X74U 
X74L 



ctagcgtcaggtgctcatccagttac 

catggtaactggatgagcacctgacg 

ctagcctccacaaacatacccacacc 

catgggtgtgggtatgtttgtggagg 

ctagctgaggtgtcaatgagagaggc 

catggcctctctcattgacacctcag 

ctagctcactcctctacgatgaacgc 

cat ggcgt teat cgtagaggagt gag 

ctagctcgtactgagatgttcctgcc 

catgggcaggaacatctcagtacgag 

ctagctgactctggacttatgacgcc 

catgggcgtcataagtccagagtcag 

ctagcagattacggagtgtgttcccc 

catgggggaacacactccgtaatctg 

ctagccttaccactgttgcagaggac 

catggtcctctgcaacagtggtaagg 

ctagcccgttatccgtactggaagtc 

catggacttccagtacggataacggg 

ctagcgtttgggtatcggctgtactc 

catggagtacagccgatacccaaacg 

ctagcgaggatgaacacaaggaggtc 

catggacctccttgtgttcatcctcg 

ctagccatagcggatagggttacgtc 

catggacgtaaccctatccgctatgg 

ctagctctcatatccctaacctggcc 

catgggccaggttagggatatgagag 

ctagcggtattgtctcgtcatgcacc 

catgggtgcatgacgagacaataccg 

ctagcatcacctacctgagattgccc 

catggggcaatctcaggtaggtgatg 

ctagcgactggggtctgttgtttctc 

catggagaaacaacagaccccagtcg 

ctagcaggggtcggagttagagaatc 

catggattctctaactccgacccct'g 

ctagcaccgaaggatgttgagtctcc 

catgggagactcaacatccttcggtg 

ctagcggtgatgactcggaac.ttctc 

catggagaagttccgagtcatcaccg 

ctagcgggtacacaaatggaaggtcc 

catgggaccttccatttgtgtacccg 

ctagcatcatctcgggtctacttcgc 

catggcgaagtagacccgagatgatg 

ctagcaatcagtagacatcgccctcc 

catgggagggcgatgtctactgattg 
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X7 5 X7 5U ctagccacggaagtctattcacacgc 

X7 5L catggcgtgtgaatagacttccgtgg 

X76 X76U ctagcaggggctgttacatgaagagc 

X76L catggctcttcatgtaacagcccctg 

X77 X77U ctagccgtgacctgctgtgatttacc 

X77L catgggtaaatcacagcaggtcacgg 

X7 8 X7 8U ctagcatagtcttagtccggcatcgc 

X7 8L catggcgatgccggactaagactatg 

X79 X79U ctagcatcactacctgcctattcgcc 

X7 9L catgggcgaataggcaggtagtgatg 

X80 X8 0U ctagcttaccttgtctaaccctcgcc 

X80L catgggcgagggttagacaaggtaag 

X81 X81U ctagctcttaatccctctggctgacc 

X81L catgggtcagccagagggattaagag 

X82 X82U ctagcagacccatccgagtaccatac 

X82L catggtatggtactcggatgggtctg 

X83 X83U ctagcagactgaaccctcaagatgcc 

X83L catgggcatcttgagggttcagtctg 

X84 X84U ctagcaggcattctgatactcctcgc 

X8 4L catggcgaggagtatcagaatgcctg 

X85 X85U ctagcctgcaagagtcatatcacggc 

X8 5L catggccgtgatatgactcttgcagg 

X8 6 X8 6U ct agcgtgggatttcgtctataccgc 

X86L catggcggtatagacgaaatcccacg 

X87 X87U ctagccagaccgcctcctaatcttac 

X87L catggtaagattaggaggcggtctgg 

X88 X8 8U ctagcatctccttgcttgtacctcgc 

X8 8L catggcgaggtacaagcaaggagatg 

X8 9 X8 9U ctagctgtgcggctatgtagtcctac 

X89L catggtaggactacatagccgcacag 

X90 X90U ctagcagtgtcctaagcaaagacggc 

X90L catggccgtctttgcttaggacactg 

X91 X91U ctagcttcccttctaccctgtaccac 

X91L catggtggtacagggtagaagggaag 

X92 X92U ctagcaaggtgtccagtggtcagatc 

X92L catggatctgaccactggacaccttg 

X93 X93U ctagcatcagcatagggaccacactc 

X93L catggagtgtggtccctatgctgatg 

X94 X94U ctagcggacggccaactatcataagc 

X94L catggcttatgatagttggccgtccg 

X95 X95U ctagctgaacctctgtgctgtaggac 

X95L catggtcctacagcacagaggttcag 

X96 X96U ctagctgacttcacctggctgtctac 

X96L catggtagacagccaggtgaagtcag 
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X97 X97U 

X97L 
X98 X98U 

X98L 
X99 X99U 

X99L 
X100 X100U 

X100L 
X101 X101U 

X101L 
X102 X102U 

X102L 
X103 X103U 

X103L 
X104 X104U 

X104L 
X105 X105U 

X105L 
X106 X106U 

X106L 
X107 X107U 

X107L 
X108 X108U 

X108L 
X109 X109U 

X109L 
X110 X110U 

X110L 
Xlll X111U 

X111L 
X112 X112U 

X112L 
X113 X113U 

X113L 
X114 X114U 

X114L 
X115 X115U 

X115L 
X116 X116U 

X116L 
X117 X117U 

X117L 
X118 X118U 

X118L 
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ctagctcctaactctattgccgagcc 
catgggctcggcaatagagttaggag 
ctagccttatcctacgcgagcagatc 
catggatctgctcgcgtaggataagg 
ctagccgcataagcacatctgtagcc 
catgggctacagatgtgcttatgcgg 
ctagcaacgtagagaacgaagccagc 
catggctggcttcgttctctacgttg 
ctagctcacggagtcctgatgtatgc 
catggcatacatcaggactccgtgag 
ctagcatgtatcccgttggtgtaggc 
catggcctacaccaacgggatacatg 
ctagcgcctgactattttgacggtcc 
datgggaccgtcaaaatagtcaggcg 
ctagcgatagcacttcaaacgtcccc 
catgggggacgtttgaagtgctatcg 
ctagcgaagtgcattcttaccgtccc 
catggggacggtaagaatgcacttcg 
ctagcccttgtcgttctaaactgggc 
catggcccagtttagaacgacaaggg 
ctagcgtttaaggagtgttcgtccgc 
catggcggacgaacactccttaaacg 
ctagccagagttaaagttgccccacc 
catgggtggggcaactttaactctgg 
ctagcgtcagaatcaatctcctggcc 
catgggccaggagattgattctgacg 
ctagcgtgcttgacctgaatccttcc 
catgggaaggattcaggtcaagcacg 
ctagcaccacccttcttcaccctatc 
catggatagggtgaagaagggtggtg 
ctagccagaaagggcagtcctaatgc 
catggcattaggactgccctttctgg 
ctagcaacccactatcgtacatccgc 
catggcggatgtacgatagtgggttg 
ctagcgaatacttgggagttgcgagc 
catggctcgcaactcccaagtattcg 
ctagcggcaataagttcaggctgtcc 
catgggacagcctgaacttattgccg 
ctagcaagggagcagacagtcatgtc 
catggacatgactgtctgctcccttg 
ctagccataacacacgggacaacacc 
catgggtgttgtcccgtgtgttatgg 
ctagccagaaacgaaggtcctaacgc 
catggcgttaggaccttcgtttctgg 



005991 7A2 I 



ERSATZBLATT (KEGEL 26) 



WO 00/59917 



PCT7EP00/02893 



XI 19 X119U ctagcgtgccaagccttaatagtgcc 

X119L catgggcactattaaggcttggcacg 

X120 X120U ctagccggatgaggatgtatcaggtc 

X120L catggacctgatacatcctcatccgg 

X121 X121U ctagccgtggcgttaaactcttaggc 

X121L catggcctaagagtttaacgccacgg 

X122 X122U ctagcctgctcttgatggataaggcc 

X122L catgggccttatccatcaagagcagg 

X123 X123U ctagcatcagagtggagagcacgatc 

X123L catggatcgtgctctccactctgatg 

X124 X124U ctagcgcacaggaaatagaagtcgcc 

X12 4L catgggcgacttctatttcctgtgcg 

X125 X125U ctagcccacccgactacagaacaatc 

X12 5L catggattgttctgtagtcgggtggg 

X126 X126U ctagccgagattacccagttgtggtc 

X12 6L catggaccacaactgggtaatctcgg 

X127 X127U ctagccgagttaatagacgcggaagc 

X127L catggcttccgcgtctattaactcgg 

X128 X12 8U ctagccgctgcggtttctctattacc 

X128L catgggtaatagagaaaccgcagcgg 

X12 9 X129U ctagctcagccgtaggtcttcaactc 

X12 9L catggagttgaagacctacggctgag 

XI 30 X130U ctagcttagtggagcctcttcacgtc 

X130L catggacgtgaagaggctccactaag 

X131 X131U ctagccagagtgtcggccttttaagc 

X131L catggcttaaaaggccgacactctgg 

X132 X132U ctagcctaaaacttgactcgcggacc 

X132L catgggtccgcgagtcaagttttagg 

X133 X133U ctagcccgtctggtcggataagatac 

X133L catggtatcttatccgaccagacggg 

X134 X134U ctagcagattggtcacaactccaggc 

X134L catggcctggagttgtgaccaatctg 

X135 X135U ctagcaccagaaggttggagaaggtc 

X135L catggaccttctccaaccttctggtg 

X136 X136U ctagccacatcttacaccgtcatcgc 

X136L catggcgatgacggtgtaagatgtgg 

X137 X137U ctagcgcgtcgggacttacaagatac 

X137L catggtatcttgtaagtcccgacgcg 

XI 38 X138U ctagcaggatggtgcaagcatactcc 

X138L catgggagtatgcttgcaccatcctg 

X13 9 X13 9U ctagcggacaaactgctggttcctac 

X139L catggtaggaaccagcagtzttgtccg 

XI 4 0 X14 0U ctagcggttgcctcaaactggagtac 

X140L catggtactccagtttgaggcaaccg 
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X141 X141U ctagctttgtaagacaccccagagcc 

X141L catgggctctggggtgtcttacaaag 

X14 2 X142U ctagcccctttggtcgttagtgctac 

X142L catggtagcactaacgaccaaagggg 

X143 X143U ctagcagagggctgagggatagaaac 

X14 3L catggtttctatccctcagccctctg 

X144 X14 4U ctagcagttcgtacctttgacacgcc 

X144L catgggcgtgtcaaaggtacgaactg 

XI 4 5 X14 5U ctagcgatttgcagtgataccacccc 

X14 5L catgggggtggtatcactgcaaatcg 

XI 4 6 XI 4 6U ctagcgagtgtagaatccggctgaac 

XI 4 6L cat ggtt cage eggattet acactcg 

X147 X147U ctagcgcaagtccgtgttcctcttac 

X147L catggtaagaggaacacggacttgcg 

XI 4 8 X14 8U ctagcctttgtacggtggtgaaaccc 

X14 8L catggggtttcaccaccgtacaaagg 

X14 9 X14 9U ctagcactttcatgtggagacgctcc 

X14 9L catgggagcgtctccacatgaaagtg 

X150 X150U ctagcaacactaagcggatgtcagcc 

X150L catgggctgacatccgcttagtgttg 

X151 X151U ctagcctaactcaactccgcaacgtc 

X151L catggacgttgcggagttgagttagg 

X152 X152U ctagcaagtagatggaaagggtgccc 

X152L catggggcaccctttccatctacttg 

X153 X153U ctagcgaaatacgaggaacgagggtc 

X153L catggaccctcgttcctcgtatttcg 

X154 X154U ctagcgaggctgctaagggaaaaagc 

X154L catggctttttcccttagcagcctcg 

XI 5 5 X155U ctagcggacgttatttcacacctcgc 

X155L catggcgaggtgtgaaataacgtccg 

X156 X156U ctagcgacacaagagcctaagccaac 

X156L catggttggcttaggctcttgtgtcg 

XI 57 X157U ctagcgtgtttgtttaccctgccagc 

X157L catggctggcagggtaaacaaacacg 

X158 X158U ctagcactgcgtcctcacaaagaagc 

X158L catggcttctttgtgaggacgcagtg 

X159 X159U ctagcagtccccgaagtcaaatagcc 

X159L catgggctatttgacttcggggactg 

XI 60 X160U ctagcgatacttcccaatgcagacgc 

X160L catggcgtctgcattgggaagtatcg 

X161 X16IU ctagcggaactaatgtcatgctgccc 

X161L catggggcagcatgacattagttccg 

X162 X162U ctagcgcgatggtgataacgtaagcc 

X162L catgggcttacgttatcaccatcgcg 
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X163 X163U ctagcctcctgtacggcaaatgttcc 

X163L catgggaacatttgccgtacaggagg 

XI 64 X164U ctagcctatttggaccgcacaagacc 

X164L catgggtcttgtgcggtccaaatagg 

X165 X165U ctagcatccttgtagcggacacgtac 

X165L catggtacgtgtccgctacaaggatg 

X166 X166U ctagcaagtgggaatagggtccgtac 

X166L catggtacggaccctattcccacttg 

XI67 X 1 6 7 U ctagcgatagaaccgactgcaatgcc 

XI 6-7 L catgggcattgcagtcggttctatcg 

X168 X168U ctagcgcgaatgaagtggactatgcc 

X168L cat gggcatagtccact teat tcgcg 

XI 6 9 X16 9U ctagccgaactttagcatccgtgacc 

X169L catgggtcacggatgctaaagttcgg 

X170 X170U ctagcgttagaaatgtctgcggtcgc 

X17 0L catggcgaccgcagacatttctaacg 

XI 71 X171U ctagcgcaccacacgaaagaatctcc 

X171L catgggagattctttcgtgtggtgcg 

X172 X17 2U ctagctcacactcttggtcggctatc 

X172L catggatagccgaccaagagtgtgag 

X17 3 X17 3U ctagctcactctggccgaactgtatc 

X17 3L catggatacagttcggccagagtgag 

XI 74 X174U ctagctggagaacggtcttgtctgtc 

X174L catggacagacaagaccgttctccag 

X175 X17 5U ctagcaggtatcgcgtccctaatgtc 

X175L catggacattagggacgcgatacctg 

X176 X176U ctagctggctcactacacgaacatgc 

X17 6L catggcatgttcgtgtagtgagccag 

XI 7 7 X177U ctagcgtaccagtgaaatcgggacac 

X177L catggtgtcccgatttcactggtacg 

X178 X178U ctagccgaagaacaacatcagagccc 

X17 8L catggggctctgatgttgttcttcgg 

X17 9 X17 9U ctagcgggtccaatcctaaagcaagc 

X17 9L catggcttgctttaggattggacccg 

X180 X180U ctagcttgagcagaagaactctcgcc 

X180L catgggcgagagttcttctgctcaag 

X181 X181U ctagcattgccgtggtgtaactacgc 

X181L catggcgtagttacaccacggcaatg 

XI 82 X182U ctagccgcatacgttctgtgcagtac 

X182L catggtactgcacagaacgtatgcgg 

X183 X18 3U ctagccagcgatatggtggtgctatc 

X183L catggatagcaccaccatatcgctgg 

X184 X184U ctagccgtaacacccagagattggac 

X184L catggtccaatctctgggtgttacgg 
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X185 
X186 
X187 
X188 
X189 
X190 
X191 
X192 
X193 
X194 
X195 
X196 
X197 
X198 
X199 
X200 
X201 
X202 
X203 
X204 
X205 
X206 



X185U 
X185L 
X186U 
X186L 
X187U 
X187L 
X188U 
X188L 
X189U 
X189L 
X190U 
X190L 
X191U 
X191L 
X192U 
X192L 
X193U 
X193L 
X194U 
X194L 
X195U 
X195L 
X196U 
X196L 
X197U 
X197L 
X198U 
X198L 
X199U 
X199L 
X200U 
X200L 
X201U 
X201L 
X202U 
X202L 
X203U 
X203L 
X204U 
X204L 
X205U 
X205L 
X206U 
X206L 



ctagctccacgataactcacaagggc 
catggcccttgtgagttatcgtggag 
ctagctcacttccctggtcgtaatgc 
catggcattacgaccagggaagtgag 
ctagcgcgttgtcacctaatacggac 
catggtccgtattaggtgacaacgcg 
ctagcatgttacactcgcatccgacc 
catgggtcggatgcgagtgtaacatg 
ctagcatgtagccagtgattgtgccc 
catggggcacaatcactggctacatg 
ctagcaagatgcagagtctaccgcac 
catggtgcggtagactctgcatcttg 
ctagcagaccgctctatcacaagcac 
catggtgcttgtgatagagcggtctg 
ctagcagggaggtccagaatcttcac 
catggtgaagattctggacctccctg 
ctagcttagaccagcactgcgaagtc 
catggacttcgcagtgctggtctaag 
ctagcccgaggcgtgactatacaaac 
catggtttgtatagtcacgcctcggg 
ctagcgacaacctacaaacgctccac 
catggtggagcgtttgtaggttgtcg 
ctagccgtcattcgtcagaccagatc 
catggatctggtctgacgaatgacgg 
ctagcagatgagtgacgatggttgcc 
catgggcaaccatcgtcactcatctg 
ctagcacccacaaccaggaaaagtcc 
catgggacttttcctggttgtgggtg 
ctagctgaggcatctttggagtacgc 
catggcgtactccaaagatgcctcag 
ctagctgtaatcggtctcaggcaagc 
catggcttgcctgagaccgattacag 
ctagcctacagtcggattggctcaac 
catggttgagccaatccgactgtagg 
ctagccttcaaggacctcgtgcatac 
catggtatgcacgaggtccttgaagg 
ctagcggcaggataaagtgctgacac 
catggtgtcagcactttatcctgccg 
ctagcgcctggacggttaaaggttac 
catggtaacctttaaccgtccaggcg 
ctagctgtccaagtaccaaagagcgc 
catggcgctctttggtacttggacag 
ctagctgcacactgggtctaacacac 
catggtgtgttagacccagtgtgcag 
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X207 
X208 
X209 
X210 
X211 
X212 
X213 
X214 
X215 
X216 
X217 
X218 
X219 
X220 
X221 
X222 
X223 
X224 
X225 
X226 
X227 
X228 



X207U 
X207L 
X208U 
X208L 
X209U 
X209L 
X210U 
X210L 
X211U 
X211L 
X212U 
X212L 
X213U 
X213L 
X214U 
X214L 
X215U 
X215L 
X216U 
X216L 
X217U 
X217L 
X218U 
X218L 
X219U 
X219L 
X220U 
X220L 
X221U 
X221L 
X222U 
X222L 
X223U 
X223L 
X224U 
X224L 
X225U 
X225L 
X226U 
X226L 
X227U 
X227L 
X228U 
X228L 



11 

ctagcaatctgtcgcctgcatagtgc 

catggcactatgcaggcgacagattg 

ctagccccttcgctcttctttcatcc 

catgggatgaaagaagagcgaagggg 

ctagcaagatattctcccacgaccgc 

catggcggtcgtgggagaatatcttg 

ctagcggtttctgcactacagccaac 

catggttggctgtagtgcagaaaccg 

ctagcaaaggcatcggacatcctacc 

catgggtaggatgtccgatgcctttg 

ctagcacgaagtatgcgttgtgagcc 

catgggctcacaacgcatacttcgtg 

ctagcggacatcggatttggataccc 

catggggtatccaaatccgatgtjccg 

ctagccggtacttttgcgactctgac 

catggtcagagtcgcaaaagtaccgg 

ctagcgttaccgctcaccgaaatctc 

catggagatttcggtgagcggtaacg 

ctagcaagaagacgatgtgtgctcgc 

catggcgagcacacatcgtcttcttg 

ctagcggctattcattctcgccctac 

catggtagggcgagaatgaatagccg 

ctagcaagggaatgtcagttctgccc 

catggggcagaactgacattcccttg 

ctagcggcttgttaggccgttaagac 

catggtcttaacggcctaacaagccg 

ctagcaaggatagagatgccgttgcc 

catgggcaacggcatctctatccttg 

ctagcagcccgacatgacagatacac 

catggtgtatctgtcatgtcgggctg 

ctagcttggagagactttgctgacgc 

catggcgtcagcaaagtctctccaag 

ctagctgcgtgtacgggcttatagac 

catggtctataagcccgtacacgcag 

ctagctcttattcgttagccgaggcc 

catgggcctcggctaacgaataagag 

ctagcagccgaacaggacaaaactcc 

catgggagttttgtcctgttcggctg 

ctagccatcattaacttcccctggcc 

catgggccaggggaagttaatgatgg 

ctagcccgaactaaatgtcacagcgc 

catggcgctgtgacatttagttcggg 

ctagcgacgcaatcttaaccaacccc 

catgggggttggttaagattgcgtcg 



ERSATZBLATT (KEGEL 26) 

6NSDOCI0: <WO 005991 7A2 I > 



WO 00/59917 



PCT/EP00/02893 



X229 
X230 
X231 
X232 
X233 
X234 
X235 
X236 
X237 
X238 
X239 
X240 
X241 
X242 
X243 
X244 
X245 
X24 6 
X247 
X248 
X249 
X250 



X229U 
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X238U 
X238L 
X239U 
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X249U 
X249L 
X250U 
X250L 
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ctagctgtatgcacatcaccgagtgc 

catggcactcggtgatgtgcatacag 

ctagccgtctcattctggtcattgcc 

catgggcaatgaccagaatgagacgg 

ctagcaggttgggttcccctatcatc 

catggatgataggggaacccaacctg 

ctagccggttgcttatcaggaatccc 

catggggattcctgataagcaaccgg 

ctagcacggccagtaagtgtccaatc 

catggattggacacttactggccgtg 

ctagcacacctgggcgtgaataactc 

catggagttattcacgcccaggtgtg 

ctagccttgggctcctgctaaaagac 

catggtcttttagcaggagcccaagg 

ctagcgcgacctctaagccttgaaac 

catggtttcaaggcttagaggtcgcg 

ctagccaggtttgggggtacatgatc 

catggatcatgtacccccaaacctgg 

ctagctcgttgtctgccctcttgtac 

catggtacaagagggcagacaacgag 

ctagcagacctcggtaaccacgaaac 

catggtttcgtggttaccgaggtctg 

ctagcagtaaggtctttgggtgccac 

catggtggcacccaaagaccttactg 

ctagcagtagccttgtgggaaccaac 

catggttggttcccacaaggctactg 

ctagcgattaacctctcggaatgcgc 

catggcgcattccgagaggttaatcg 

ctagcgcgatattgttccctgcttcc 

catgggaagcagggaacaatatcgcg 

ctagccaaccgtgttagcgaccatac 

catggtatggtcgctaacacggttgg 

ctagcgaatgggtggtggaaggatac 

catggtatccttccaccacccattcg 

ctagcaccaagtcgctgtcaactgac 

catggtcagttgacagcgacttggtg 

ctagccattttcaggaaggagacggc 

catggccgtctccttcctgaaaatgg 

ctagctggttggactgatacgaacgc 

catggcgttcgtatcagtccaaccag 

ctagcattcacccaatggtctacggc 

catggccgtagaccattgggtgaatg 

ctagcggtggtaggcatatccgaaac 

catggtttcggatatgcctaccaccg 
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X251 X251U ctagctgtctgtgaccttgggattgc 

X251L catggcaatcccaaggtcacagacag 

X252 X252U ctagccaagcctcaatgcctaaaggc 

X252L catggcctttaggcattgaggcttgg 

X253 X253U ctagcacttcttacgtcaccgcgatc 

X253L catggatcgcggtgacgtaagaagtg 

X254 X2 54U ctagcggtt cctcaccattcggttac 

X254L catggtaaccgaatggtgaggaaccg 

X255 X255U ctagcagagtcaatgtcggttggctc 

X255L catggagccaaccgacattgactctg 
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Name Algomer 

00 tcgaggatatccgggcttcgggtgaccgggatcttaaga 

cctataggcccgaagcccactggccctagaattcttcga 

01 tcgaggatatcccttggcggtgaggcggcgatcttaaga 

cctatagggaaccgccactccgccgctagaattcttcga 

02 tcgaggatatctgtgggctacggggccgcgatcttaaga 

cctatagacacccgatgccccggcgctagaattcttcga 

03 tcgaggatatctaggtggctgcgcggggcgatcttaaga 

cctatagatccaccgacgcgccccgctagaattcttcga 
SO ttaagcgaagtggcctggcgggcgctagcg 

cgcttcaccggaccgcccgcgatcgcttaa 
ttaagaacccgagccccggacgggctagcg 

cttgggctcggggcctgcccgatcgcttaa 
ttaagcgcaccaggcagagcgcggctagcg 

cgcgtggtccgtctcgcgccgatcgcttaa 
S3 ttaagtcctcgtggtcgggcggcgctagcg 

caggagcaccagcccgccgcgatcgcttaa 
EO gatccccatggaatcccttggcggtgaggcggcgatatct 

gggtaccttagggaaccgccactccgccgctatagagatc 
El gatccccatggaatctgtgggctacggggccgcgatatct: 

gggtaccttagacacccgatgccccggcgctatagagatc 
E2 gatccccatggaatctaggtggctgcgcggggcgatatct 

gggtaccttagatccaccgacgcgccccgctatagagatc 
E3 gatccccatggaatccgcaagccccaaggccccgatatct 

gggtaccttaggcgttcggggttccggggctatagagatc 
XO ctagcgtatgccctgtagtttggagc 

gcatacgggacatcaaacctcggtac 
XI ctagcgtaaagccaactgtaccctgc 

gcatttcggttgacatgggacggtac 
X2 ctagcgagactaaggttgttggtcgc 

gctctgattccaacaaccagcggtac 
X3 ctagcgttccttcaagtcactcgtcc 

gcaaggaagttcagtgagcagggtac 
X4 ctagccctgcccacagtagaataagc 

gggacgggtgtcatcttattcggtac 
X5 ctagcgaatcaagactcgtgctaccc 

gcttagttctgagcacgatggggtac 
X6 ctagcgatgacagttagacgcttccc 

gctactgtcaatctgcgaaggggtac 
X7 ctagcctcctgaacctaagtcatcgc 

ggaggacttggattcagtagcggtac 
X8 ctagcccaaagttacagacctcagcc 

gggtttcaatgtctggagtcgggtac 
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X9 ctagcgacctatgcaatctactcgcc 

gctggatacgttagatgagcgggtac 
XI 0 ctagccagtagtaatcttccgcaggc 

ggtcatcattagaaggcgtccggtac 
XI 1 ctagcctgttggtgggtactcctaac 

ggacaaccacccatgaggattggtac 
X12 ctagcaacgaggtggtacgacatagc 

gttgctccaccatgctgtatcggtac 
X13 ctaaccqcagtcattatagagagccc 

ggcgtcagtaatatctctcggggtac 
XI 4 ctagcgtacttgtccctccagcatac 

gcatgaacagggaggtcgtatggtac 
X15 ctagcatcctgtgtgcctaagtacgc 

gtaggacacacggattcatgcggtac 
XI 6 ctagcgaggcacttgacgtatgactc 

gctccgtgaactgcatactgaggtac 
XI 7 ctagcgggatacctttctaagcgacc 

gccctatggaaagattcgctgggtac 
X18 ctagcggataggtcgcagtcttgtac 

gcctatccagcgtcagaacatggtac 
X19 ctagcgtacagtgcgaagagggtaac 

gcatgtcacgcttctcccattggtac 
X20 ctagcgcctccgacacagttactaac 

gcggaggctgtgtcaatgattggtac 
X21 ctagcgtgggtctggaacactattgc 

gcacccagaccttgtgataacggtac 
X22 ctagcaactcctcactgttcactgcc 

gttgaggagtgacaagtgacgggtac 
X23 ctagccgtatggtatatcgtcagccc 

ggcataccatatagcagtcggggtac 
X24 ctagcgcacagaccaaggacattacc 

gcgtgtctggttcctgtaatgggtac 
X25 ctagcctcccactaaacggtcctatc 

ggagggtgatttgccaggataggtac 
X26 ctagccacggaccgagtatctattgc 

ggtgcctggctcatagataacggtac 
X27 ctagcgtctgatgagcgcagttagtc 

gcagactactcgcgtcaatcaggtac 
X28 ctagcgagaatgcggtgatagtgacc 

gctcttacgccactatcactgggtac 
X29 ctagcctacactaaccgacggaatgc 

ggatgtgattggctgccttacggtac 
X30 ctagcaagtccttgttacgagtcccc 

gttcaggaacaatgctcagggggtac 
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X31 ctagcacctgaagttacgggaagtcc 

gtggacttcaatgcccttcagggtac 
X32 ctagcaacaggttccttacagagggc 

gttgtccaaggaatgtctcccggtac 
X33 ctagcacgtagccaagacttatcccc 

gtgcatcggttctgaatagggggtac 
X34 ctagccagtcaggtctattgttgccc 

ggtcagtccagataacaacggggtac 
X35 ctagcgagaaccatattgcccctacc 

gctcttggtataacggggatgggtac 
X36 ctagccataaagaggagactgggctc 

ggtatttctcctctgacccgaggtac 
X37 ctagccatagtctgcgaatactgccc 

ggtatcagacgcttatgacggggtac 
X38 ctagcgttagggcagccttaggtaac 

gcaatcccgtcggaatccattggtac 
X39 ctagcatagatgtgacagtgggacgc 

gtatctacactgtcaccctgcggtac 
ctagcgattagagttgtagggcgctc 

gctaatctcaacatcccgcgaggtac 
ctagctggaagtacgtgtgggatagc 

gaccttcatgcacaccctatcggtac 
X42 ctagctgagatagtcgtggatggtcc 

gactctatcagcacctaccagggtac 
X43 ctagcacgacctgttaccgttacctc 

gtgctggacaatggcaatggaggtac 
X4 4 ctagccattgct ggaactgctactcc 

ggtaacgaccttgacgatgagggtac 
X45 ctagcgtaccccacccacataaagtc 

gcatggggtgggtgtatttcaggtac 
X4 6 ctagcagtgtaggaatacccgtgct c 

gtcacatccttatgggcacgaggtac 
X47 ctagccgttcgctatgttctacagcc 

ggcaagcgatacaagatgtcgggtac 
X48 ctagcccctgtccccatacattactc 

ggggacaggggtatgtaatgaggtac 
X4 9 ctagcatgtaggcaactgtcgtcacc 

gtacatccgttgacagcagtgggtac 
X50 ctagcgtatgttcccagcgagtacac 

gcatacaagggtcgctcatgtggtac 
X51 ctagcgtgtaataccacgggtgttgc 

gcacattatggtgcccacaacggtac 
ctagctgtagtggtctttacgtggcc 

gacatcaccagaaatgcaccgggtac 



X52 
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X53 ctagcgtcaggtgctcatccagttac 

gcagtccacgagtaggtcaatggtac 
X54 ctagcctccacaaacatacccacacc 

ggaggtgtttgtatgggtgtgggtac 
X55 ctagctgaggtgtcaatgagagaggc 

gactccacagttactctctccggtac 
X56 ctagctcactcctctacgatgaacgc 

gagtgaggagatgctacttgcggtac 
X57 ctagctcgtactgagatgttcctgcc 

gagcatgactctacaaggacgggtac 
X58 ctagctgactctggacttatgacgcc 

gactgagacctgaatactgcgggtac 
X59 ctagcagattacggagtgtgttcccc 

gtctaatgcctcacacaagggggtac 
X60 ctagccttaccactgttgcagaggac 

ggaatggtgacaacgtctcctggtac 
X61 ctagcccgttatccgtactggaagtc 

gggcaataggcatgaccttcaggtac 
X62 ctagcgtttgggtatcggctgtactc 

gcaaacccatagccgacatgaggtac 
X63 ctagcgaggatgaacacaaggaggtc 

gctcctacttgtgttcctccaggtac 
X64 ctagccatagcggatagggttacgtc 

ggtatcgcctatcccaatgcaggtac 
X65 ctagctctcatatccctaacctggcc 

gagagtatagggattggaccgggtac 
X66 ctagcggtattgtctcgtcatgcacc 

gccataacagagcagtacgtgggtac 
X67 ctagcatcacctacctgagattgccc 

gtagtggatggactctaacggggtac 
X68 ctagcgactggggtctgttgtttctc 

gctgaccccagacaacaaagaggtac 
X69 ctagcaggggtcggagttagagaatc 

gtccccagcctcaatctcttaggtac 
X70 ctagcaccgaaggatgttgagtctcc 

gtggcttcctacaactcagagggtac 
X71 ctagcggtgatgactcggaacttctc 

gccactactgagccttgaagaggtac 
X72 ctagcgggtacacaaatggaaggtcc 

gcccatgtgtttaccttccagggtac 
X73 ctagcatcatctcgggtctacttcgc 

gtagtagagcccagatgaagcggtac 
X74 ctagcaatcagtagacatcgccctcc 

gttagtcatctgtagcgggagggtac 
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X75 ctagccacggaagtctattcacacgc 

ggtgccttcagataagtgtgcggtac 
X7 6 ctagcaggggctgttacatgaagagc 

gtccccgacaatgtacttctcggtac 
X7 7 ctagccgtgacctgctgtgatttacc 

ggcactggacgacactaaatgggtac 
X78 ctagcatagtcttagtccggcatcgc 

gtatcagaatcaggccgtagcggtac 
X7 9 ctagcatcactacctgcctattcgcc 

gtagtgatggacggataagcgggtac 
X80 ctagcttaccttgtctaaccctcgcc 

gaatggaacagattgggagcgggtac 
X81 ctagctcttaatccctctggctgacc 
| gagaattagggagaccgactgggtac 
^82 ctagcagacccatccgagtaccatac 

gtctgggtaggctcatggtatggtac 
X8 3 ctagcagactgaaccctcaagatgcc 

gtctgacttgggagttctacgggtac 
X84 ctagcaggcattctgatactcctcgc 

gtccgtaagactatgaggagcggtac 
X8 5 ct agcctgcaagagt catatcacggc 

ggacgttctcagtatagtgccggtac 
X86 ctagcgtgggatttcgtctataccgc 

gcaccctaaagcagatatggcggtac 
X87 ctagccagaccgcctcctaatcttac 

ggtctggcggaggattagaatggtac 
X88 ctagcatctccttgcttgtacctcgc 

gtagaggaacgaacatggagcggtac 
X8 9 ctagctgtgcggctatgtagtcctac 

gacacgccgatacatcaggatggtac 
X90 ctagcagtgtcctaagcaaagacggc 

gtcacaggattcgtttctgccggtac 
X91 ctagcttcccttctaccctgtaccac 

gaagggaagatgggacatggtggtac 
X92 ctagcaaggtgtccagtggtcagatc 

gttccacaggtcaccagtctaggtac 
X93 ctagcatcagcatagggaccacactc 

gtagtcgtatccctggtgtgaggtac 
X94 ctagcggacggccaactatcataagc 

gcctgccggttgatagtattcggtac 
X95 ctagctgaacctctgtgctgtaggac 

gacttggagacacgacatcctggtac 
X96 ctagctgacttcacctggctgtctac 

gactgaagtggaccgacagatggtac 
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X97 ctagctcctaactctattgccgagcc 

gaggattgagataacggctcgggtac 
X98 ctagccttatcctacgcgagcagatc 

ggaataggatgcgctcgtctaggtac 
X99 ctagccgcataagcacatctgtagcc 

ggcgtattcgtgtagacatcgggtac 
XI 00 ctagcaacgtagagaacgaagccagc 

gttgcatctcttgcttcggtcggtac 
X101 ctagctcacggagtcctgatgtatgc 

gagtgcctcaggactacatacggtac 
X102 ctagcatgtatcccgttggtgtaggc 

gtacatagggcaaccacatccggtac 
X103 ctagcgcctgactattttgacggtcc 

gcggactgataaaactgccagggtac 
X104 ctagcgatagcacttcaaacgtcccc 

gctatcgtgaagtttgcagggggtac 
X105 ctagcgaagtgcattcttaccgtccc 

gcttcacgtaagaatggcaggggtac 
X106 ctagcccttgtcgttctaaactgggc 

gggaacagcaagatttgacccggtac 
X107 ctagcgtttaaggagtgttcgtccgc 

gcaaattcctcacaagcaggcggtac 
X108 ctagccagagttaaagttgccccacc 

ggtctcaatttcaacggggtgggtac 
X109 ctagcgtcagaatcaatctcctggcc 

gcagtcttagttagaggaccgggtac 
X110 ctagcgtgcttgacctgaatccttcc 

gcacgaactggacttaggaagggtac 
Xlll ctagcaccacccttcttcaccctatc 

gtggtgggaagaagtgggataggtac 
X112 ctagccagaaagggcagtcctaatgc 

ggtctttcccgtcaggattacggtac 
X113 ctagcaacccactatcgtacatccgc 

gttgggtgatagcatgtaggcggtac 
X114 ctagcgaatacttgggagttgcgagc 

gcttatgaaccctcaacgctcggtac 
X115 ctagcggcaataagttcaggctgtcc 

gccgttattcaagtccgacagggtac 
X116 ctagcaagggagcagacagtcatgtc 

gttccctcgtctgtcagtacaggtac 
X117 ctagccataacacacgggacaacacc 

ggtattgtgtgccctgttgtgggtac 
X118 ctagccagaaacgaaggtcctaacgc 

ggtctttgcttccaggattgcggtac 
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X119 ctagcgtgccaagccttaatagtgcc 

gcacggttcggaattatcacgggtac 
X120 ctagccggatgaggatgtatcaggtc 

ggcctactcctacatagtccaggtac 
X121 ctagccgtggcgttaaactcttaggc 

ggcaccgcaatttgagaatccggtac 
XI 22 ctagcctgctcttgatggataaggcc 

ggacgagaactacctattccgggtac 
X12 3 ctagcatcagagtggagagcacgatc 

gtagtctcacctctcgtgctaggtac 
X124 ctagcgcacaggaaatagaagtcgcc 

gcgtgtcctttatcttcagcgggtac 
X125 ctagcccacccgactacagaacaatc 

gggtgggctgatgtcttgtjtaggtac 
X126 ctagccgagattacccagttgt^gtc 

ggctctaatgggtcaacaccaggtac 
X127 ctagccgagttaatagacgcggaagc 

ggctcaattatctgcgccttcggtac 
X128 ctagccgctgcggtttctctattacc 

ggcgacgccaaagagataatgggtac 
X129 ctagctcagccgtaggtcttcaactc 

gagtcggcatccagaagttgaggtac 
X130 ctagcttagtggagcctcttcacgtc 

gaatcacctcggagaagtgcaggtac 
X131 ctagccagagtgtcggccttttaagc 

ggtctcacagccggaaaattcggtac 
X132 ctagcctaaaacttgactcgcggacc 

ggattttgaactgagcgcctgggtac 
X133 ctagcccgtctggtcggataagatac 

gggcagaccagcctattctatggtac 
X134 ctagcagattggtcacaactccaggc 

gtctaaccagtgttgaggtccggtac 
X135 ctagcaccagaaggttggagaaggtc 

gtggtcttccaacctcttccaggtac 
X136 ctagccacatcttacaccgtcatcgc 

ggtgtagaatgtggcagtagcggtac 
XI 37 ctagcgcgtcgggacttacaagatac 

gcgcagccctgaatgttctatggtac 
X138 ctagcaggatggtgcaagcatactcc 

gtcctaccacgttcgtatgagggtac 
X139 ctagcggacaaactgctggttcctac 

gcctgtttgacgaccaaggatggtac 
XI 4 0 ctagcggttgcctcaaactggagtac 

gccaacggagtttgacctcatggtac 
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X141 ctagctttgtaagacaccccagagcc 

gaaacattctgtggggtctcgggtac 
X142 ctagcccctttggtcgttagtgctac 

ggggaaaccagcaatcacgatggtac 
X143 ctagcagagggctgagggatagaaac 

gtctcccgactccctatctttggtac 
XI 4 4 ctagcagttcgtacctttgacacgcc 

gtcaagcatggaaactgtgcgggtac 
X145 ctagcgatttgcagtgataccacccc 

gctaaacgtcactatggtgggggtac 
X14 6 ctagcgagtgtagaatccggctgaac 

gctcacatcttaggccgacttggtac 
X147 ctagcgcaagtccgtgttcctcttac 

\ gcgttcaggcacaaggagaatggtac 
XI 4 8 ctagcctt tgtacggtggtgaaaccc 

ggaaacatgccaccactttggggtac 
X14 9 ctagcacttt catgtggagacgctcc 

gtgaaagtacacctctgcgagggtac 
X150 ctagcaacactaagcggatgtcagcc 

gttgtgattcgcctacagtcgggtac 
X151 ctagcctaactcaactccgcaacgtc 

ggattgagttgaggcgttgcaggtac 
X152 ctagcaagtagatggaaagggtgccc 

gttcatctacctttcccacggggtac 
X153 ctagcgaaatacgaggaacgagggtc 

gctttatgctccttgctcccaggtac 
X154 ctagcgaggctgctaagggaaaaagc 

gctccgacgattccctttttcggtac 
X155 ctagcggacgttatttcacacctcgc 

gcctgcaataaagtgtggagcggtac 
X156 ctagcgacacaagagcctaagccaac 

gctgtgttctcggattcggttggtac 
X157 ctagcgtgtttgtttaccctgccagc 

gcacaaacaaatgggacggtcggtac 
X158 ctagcactgcgtcctcacaaagaagc 

gtgacgcaggagtgtttcttcggtac 
X159 ctagcagtccccgaagtcaaatagcc 

gtcaggggcttcagtttatcgggtac 
XI 60 ctagcgatacttcccaatgcagacgc 

gctatgaagggttacgtctgcggtac 
X161 ctagcggaactaatgtcatgctgccc 

gccttgattacagtacgacggggtac 
XI 62 ctagcgcgatggtgataacgtaagcc 

gcgctaccactattgcattcgggtac 
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XI 63 ctagcctcctgtacggcaaatgttcc 

ggaggacatgccgtttacaagggtac 
X164 ctagcctatttggaccgcacaagacc 

ggataaacctggcgtgttctgggtac 
X165 ctagcatccttgtagcggacacgtac 

gtaggaacatcgcctgtgcatggtac 
XI 66 ctagcaagtgggaatagggtccgtac 

gttcacccttatcccaggcatggtac 
X167 ctagcgatagaaccgactgcaatgcc 

gctatcttggctgacgttacgggtac 
XI 68 ctagcgcgaatgaagtggactatgcc 

gcgcttacttcacctgatacgggtac 
XI 6 9 ctagccgaactttagcatccgtgacc 

ggcttgaaatcgtaggcactgggtac j 
X170 ctagcgttagaaatgtctgcggtcgc 

gcaatctttacagacgccagcggtac 
X17 1 ctagcgcaccacacgaaagaatctcc 

gcgtggtgtgctttcttagagggtac 
X172 ctagctcacactcttggtcggctatc 

gagtgtgagaaccagccgataggtac 
XI 7 3 ctagctcactctggccgaactgtatc 

gagtgagaccggcttgacataggtac 
X17 4 ctagctggagaacggtcttgtctgtc 

gacctcttgccagaacagacaggtac 
X175 ctagcaggtatcgcgtccctaatgtc 

gtccatagcgcagggattacaggtac 
X17 6 ctagctggct cactacacgaacatgc 

gaccgagtgatgtgcttgtacggtac 
XI 7 7 ctagcgtaccagtgaaatcgggacac 

gcatggtcactttagccctgtggtac 
XI 78 ctagccgaagaacaacatcagagccc 

ggcttcttgttgtagtctcggggtac 
X17 9 ctagcgggtccaat cctaaagcaagc 

gcccaggttaggatttcgttcggtac 
X180 ctagcttgagcagaagaactctcgcc 

gaactcgtcttcttgagagcgggtac 
XI 81 ctagcattgccgtggtgtaactacgc 

gtaacggcaccacattgatgcggtac 
XI 8 2 ctagccgcatacgttctgtgcagtac 

ggcgtatgcaagacacgtcatggtac 
X18 3 ctagccagcgatatggtggtgctatc 

ggtcgctataccaccacgataggtac 
X184 ctagccgtaacacccagagattggac 

ggcattgtgggtctctaacctggtac 



BNSDOCID: <WO. 00599 17A2_I_> 



ERSATZBLATT (KEGEL 26) 



WO 00/59917 



23 



PCT/EPOO/02893 



X185 ctagctccacgataactcacaagggc 

gaggtgctattgagtgttcccggtac 
XI 8 6 ctagctcacttccctggtcgtaatgc 

gagtgaagggaccagcattacggtac 
XI 8 7 ctagcgcgttgtcacctaatacggac 

gcgcaacagtggattatgcctggtac 
XI 8 8 ctagcatgttacactcgcatccgacc 

gtacaatgtgagcgtaggctgggtac 
X18 9 ctfagcargragccagtgattgtgccc 

gtacatcggtcactaacacggggtac 
XI 90 ctagcaagatgcagagtctaccgcac 

gttctacgtctcagatggcgtggtac 
XI 91 ctagcagaccgctctatcacaa^cac 

gtctggcgagatagtgttcgtggtac 
XI 92 ctagcagggaggtccagaatcttcac 

gtccctccaggtcttagaagtggtac 
X193 ctagcttagaccagcactgcgaagtc 

gaatctggtcgtgacgcttcaggtac 
XI 94 ctagcccgaggcgtgactatacaaac 

gggctccgcactgatatgirttggtac 
XI 95 ctagcgacaacctacaaacgctccac 

gctgttggatgtttgcgaggtggtac 
X196 ctagccgtcattcgtcagaccagatc 

ggcagtaagcagtctggtctaggtac 
X197 ctagcagatgagtgacgatggttgcc 

gtctactcactgctaccaacgggtac 
X198 ctagcacccacaaccaggaaaagtcc 

gtgggtgttggtccttttcagggtac 
XI 99 ctagctgaggcatctttggagtacgc 

gactccgtagaaacctcatgcggtac 
X200 ctagctgtaatcggtctcaggcaagc 

gacattagccagagtccgttcggtac 
X201 ctagcctacagtcggattggctcaac 

ggatgtcagcctaaccgagttggtac 
X202 ctagccttcaaggacctcgtgcatac 

ggaagttcctggagcacgtatggtac 
X203 ctagcggcaggataaagtgctgacac 

gccgtcctatttcacgactgtggtac 
X204 ctagcgcctggacggttaaaggttac 

gcggacctgccaatttccaatggtac 
X205 ctagctgtccaagtaccaaagagcgc 

gacaggttcatggtttctcgcggtac 
X206 ctagctgcacactgggtctaacacac 

gacgtgtgacccagattgtgtggtac 
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ctagcaatctgtcgcctgcatagtgc 

gttagacagcggacgtatcacggtac 
ctagccccttcgctcttctttcatcc 

ggggaagcgagaagaaagtagggtac 
ctagcaagatattctcccacgaccgc 

gttctataagagggtgctggcggtac 
ctagcggtttctgcactacagccaac 

gccaaagacgtgatgtcggttggtac 
ctagcaaaggcatcggacatcctacc 

gtttccgtagcctgtaggatgggtac 
ctagcacgaagtatgcgttgtgagcc 

gtgcttcatacgcaacactcgggtac 
ctagcggacatcggatttggataccc 

gcctgtagcctaaacctatggggtac 
ctagccggtacttttgcgactctgac 

ggccatgaaaacgctgagactggtac 
ctagcgttaccgctcaccgaaatctc 

gcaatggcgagtggctttagaggtac 
ctagcaagaagacgatgtgtgctcgc 

gttcttctgctacacacgagcggtac 
ctagcggctattcattctcgccctac 

gccgataagtaagagcgggatggtac 
ctagcaagggaatgtcagttctgccc 

gttcccttacagtcaagacggggtac 
ctagcggcttgttaggccgttaagac 

gccgaacaatzccggcaattctggtac 
ctagcaaggatagagatgccgttgcc 

gttcctatctctacggcaacgggtac 
ctagcagcccgacatgacagatacac 

gtcgggctgtactgtctatgtggtac 
ctagcttggagagactttgctgacgc 

gaacctctctgaaacgactgcggtac 
ctagctgcgtgtacgggcttatagac 

gacgcacatgcccgaatatctggtac 
ctagctcttattcgttagccgaggcc 

gagaataagcaatcggctccgggtac 
ctagcagccgaacaggacaaaactcc 

gtcggcttgtcctgttttgagggtac 
ctagccatcattaacttcccctggcc 

ggtagtaattgaaggggaccgggtac 
ctagcccgaactaaatgtcacagcgc 

gggcttgatttacagtgtcgcggtac 
ctagcgacgcaatcttaaccaacccc 

gctgcgttagaattggttgggggtac 
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ctagctgtatgcacatcaccgagtgc 

gacatacgtgtagtggctcacggtac 
ctagccgtctcattctggtcattgcc 

ggcagagtaagaccagtaacgggtac 
ctagcaggttgggttcccctatcatc 

gtccaacccaaggggatagtaggtac 
ctagccggttgcttatcaggaatccc 

ggccaacgaatagtccttaggggtac 
ctagcacggccagtaagtgtccaatc 

gtgccggtcattcacaggttaggtac 
ctagcacacctgggcgtgaataactc 

gtgtggacccgcacttattgaggtac 
ctagccttgggctcctgctaaaagac 

ggaacccgaggacgattttctggtac 
ctagcgcgacctctaagccttgaaac 

gcgctggagattcggaactttggtac 
ctagccaggtttgggggtacatgatc 

ggtccaaacccccatgtactaggtac 
ctagctcgttgtctgccctcttgtac 

gagcaacagacgggagaacatggtac 
ctagcagacctcggtaaccacgaaac 

gtctggagccattggtgctttggtac 
ctagcagtaaggtctttgggtgccac 

gtcattccagaaacccacggtggtac 
ctagcagtagccttgtgggaaccaac 

gtcatcggaacacccttggttggtac 
ctagcgattaacctctcggaatgcgc 

gctaattggagagccttacgcggtac 
ctagcgcgatattgttccctgcttcc 

gcgctataacaagggacgaagggtac 
ctagccaaccgtgttagcgaccatac 

ggttggcacaatcgctggtatggtac 
ctagcgaatgggtggtggaaggatac 

gcttacccaccaccttcctatggtac 
ctagcaccaagtcgctgtcaactgac 

gtggttcagcgacagttgactggtac 
ctagccattttcaggaaggagacggc 

ggtaaaagtccttcctctgccggtac 
ctagctggttggactgatacgaacgc 

gaccaacctgactatgcttgcggtac 
ctagcattcacccaatggtctacggc 

gtaagtgggttaccagatgccggtac 
ctagcggtggtaggcatatccgaaac 

gccaccatccgtataggctttggtac 
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ctagctgtctgtgaccttgggattgc 

gacagacactggaaccctaacggtac 
ctagccaagcctcaatgcctaaaggc 

ggttcggagttacggatttccggtac 
ctagcacttcttacgtcaccgcgatc 

gtgaagaatgcagtggcgctaggtac 
ctagcggttcctcaccattcggttac 

gccaaggagtggtaagccaatggtac 
ctagcagagtcaatgtcggttggctc 

gtctcagttacagccaaccgaggtac 
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